Model accuracy,
eerlijk gemeten.
Gavelia meet zijn eigen nauwkeurigheid tegen een gecureerde set geverifieerde veilinguitslagen (de golden-set) en tegen productie-telemetrie. Deze pagina toont de huidige staat, de trend over tijd, en de uitsplitsing per marktsegment. Geen cherry-picking — alle metingen komen uit dezelfde pipeline.
Het metrics-dashboard is voorbereid maar wacht op data. Zodrascripts/evaluate_golden.pyen de wekelijkse snapshot-cron draaien vult de Firestore-collectiemodel_metricszich en verschijnen de cijfers hieronder automatisch.
- ▸Laatste meting — mediaan fout, binnen-25%, CI-hit-rate
- ▸Uitsplitsing per medium (schilderij, print, tekening, sculptuur)
- ▸Uitsplitsing per prijsklasse (<€1k, €1-5k, €5-25k, €25k+)
- ▸Trend over tijd — wekelijkse golden-set meting
- ▸Benchmark vs naive baseline (median per medium)
- ▸Per-bucket hit rates (high/medium/low nComps)
De helft van onze taxaties zit binnen dit percentage van de werkelijke verkoopprijs. Lager is beter.
Percentage van taxaties dat binnen 25% of 50% fout eindigt. Voor B2B (notarissen, verzekeraars) is 25% de relevante drempel.
Hoe vaak de werkelijke prijs binnen ons 90% betrouwbaarheidsinterval valt. Moet rond 90% liggen. Afwijkend >3pp = signaal voor herkalibratie.
Gecureerde set geverifieerde verkopen waar we onze modelprestaties tegen meten. Onafhankelijk van wekelijkse data-injecties — geldig als stabiele benchmark.