Bir tahminin ne kadar iyi olduğunu ölçmek sandığınızdan zordur. Proper scoring rules nedir?
VoxSim Metodoloji Notu serisi — platformun yöntemini sade dille anlatan kısa, evergreen yazılar.
Bir tahmin "isabetli" mi? Basit hata payı (MAE) yanıltabilir. VoxSim, istatistikte strictly proper kabul edilen ölçütleri kullanır: Brier skoru (1950) ve Log-skor (Gneiting-Raftery 2007). Bu ölçütler, modeli "emin olduğu yerde haklı, emin olmadığı yerde temkinli" olmaya zorlar — blöf ödüllendirilmez.
Detay: Doğruluk skoru hesaplama.
VoxSim Hakkında
VoxSim, politika ve söylem taslaklarını 12 siyasi küme × demografi ekseninde test eden bir B2B sentetik toplum simülasyon platformudur. Platforma erişim için başvuru sayfasına bakınız.