Early-stage metrics·Wij publiceren onze tussentijdse stand transparant — de cijfers zitten momenteel nog niet op de streefwaardes voor 12 maanden·Context en streefwaardes →

Methodologie

Model accuracy,
eerlijk gemeten.

Gavelia meet zijn eigen nauwkeurigheid tegen een gecureerde set geverifieerde veilinguitslagen (de golden-set) en tegen productie-telemetrie. Deze pagina toont de huidige staat, de trend over tijd, en de uitsplitsing per marktsegment. Geen cherry-picking — alle metingen komen uit dezelfde pipeline.

26.415

geverifieerde verkopen

175

kunstenaars met data

23.215

records uitgesloten

13.279

valuta gecorrigeerd

Voordat een verkoop meetelt, controleren we elk record op drie assen: valuta (buitenlandse hamerprijzen omgerekend, niet-herleidbare bedragen uitgesloten), attributie (naam-collisies, boeken en verzamellots eruit) en techniek (de juiste categorie, zo nodig met beeld- of tekstanalyse). De accuracy-benchmark hieronder wordt herijkt nu deze opschoning ook de oude testset bleek te raken — een geijkt cijfer volgt zodra dat schoon en eerlijk kan.

In opbouw

Het metrics-dashboard is voorbereid maar wacht op data. Zodrascripts/evaluate_golden.pyen de wekelijkse snapshot-cron draaien vult de Firestore-collectiemodel_metricszich en verschijnen de cijfers hieronder automatisch.

▸Laatste meting — mediaan fout, binnen-25%, CI-hit-rate
▸Uitsplitsing per medium (schilderij, print, tekening, sculptuur)
▸Uitsplitsing per prijsklasse (<€1k, €1-5k, €5-25k, €25k+)
▸Trend over tijd — wekelijkse golden-set meting
▸Benchmark vs naive baseline (median per medium)
▸Per-bucket hit rates (high/medium/low nComps)

Hoe te lezen

Mediaan fout

De helft van onze indicaties zit binnen dit percentage van de werkelijke verkoopprijs. Lager is beter.

Binnen 25 / 50%

Percentage van indicaties dat binnen 25% of 50% fout eindigt. Voor B2B (notarissen, verzekeraars) is 25% de relevante drempel.

CI 90% hit-rate

Hoe vaak de werkelijke prijs binnen ons 90% betrouwbaarheidsinterval valt. Moet rond 90% liggen. Afwijkend >3pp = signaal voor herkalibratie.

Golden-set

Gecureerde set geverifieerde verkopen waar we onze modelprestaties tegen meten. Onafhankelijk van wekelijkse data-injecties — geldig als stabiele benchmark.

Model accuracy,eerlijk gemeten.

Model accuracy,
eerlijk gemeten.