VoxSim nasıl çalışır?
Sentetik popülasyon modeli, tarihsel kalibrasyon ve doğruluk skoru — ticari sırları açıklamadan şeffaf bir anlatım.
Birincil eksen: 12 siyasi cluster + yankı odası
VoxSim simülasyonun birincil ekseninde demografi değil, siyasi eğilim vardır. Türkiye toplumu 12 siyasi cluster'a bölünür (sosyal demokrat, dindar muhafazakar, milliyetçi muhafazakar, kürt siyasi, genç kararsız, vb). Her cluster kendi yankı odasından beslenir.
Her cluster için ~10 lisanslı haber kaynağından 4 zaman penceresinde makale derlenir; LLM bu zaman-ağırlıklı külliyatı okuyup cluster'ın güncel zihinsel arka planını çıkarır (current_grievances, enduring_anxieties, narrative_frames). Söylem değerlendirmesi bu arka plana karşı yapılır.
12
siyasi cluster
10
lisanslı kaynak / cluster
4
zaman penceresi
Zaman-ağırlıklı hafıza eğrisi (forgetting curve)
Toplum yakını canlı hatırlar, uzağı soluk. Yakın gündem (son 2 hafta) %50 ağırlıkla, 1 yıllık arka plan %5 ağırlıkla snapshot'a girer — Ebbinghaus benzeri kademeli unutma.
Bilgi ekolojisi haritalama (3-tier hibrit kaynak)
Mainstream haber kaynaklarının doğal kalite filtresi, bir cluster'ı tanımlayan bazı en kritik echo chamber kaynaklarını dışarıda bırakır. Yeni Akit, Veryansın TV, Mezopotamya Ajansı gibi yayıncılar küresel haber aggregator'larında yer almaz; ama dindar muhafazakar, ulusalcı sol veya kürt siyasi cluster'ının gerçek mood'unu mainstream kaynaklardan çok daha iyi açıklar.
VoxSim bu kör noktayı 3-tier hibrit yapı ile kapatır: lisanslı aggregator (mainstream) + yayıncı RSS feed'leri (niş + echo chamber) + son çare DOM scraping (RSS açmayan kritik kaynaklar için). Her makale acquisition_method × quality_tier matrisinde etiketlenir.
Anaakım doğrulanmış aggregator
Hürriyet, Sabah, Cumhuriyet gibi anaakım yayıncılar — fact-check standartı. Lisanslı aggregator (NewsAPI.ai/EventRegistry) üzerinden çekilir.
Niş doğrulanmış direct_rss / direct_license
Niş ama editorial standartı olan yayıncılar (Gazete Duvar, T24 vb.) — yayıncının kendi RSS feed'i veya direkt sözleşme.
Niş doğrulanmamış direct_rss
Küçük yayıncılar — doğrulanmamış ama cluster için sinyal verebilir.
Yankı odası direct_rss / dom_scrape
Cluster'a özgü ideolojik yayıncılar (Yeni Akit, Veryansın TV vb.) — cluster mood'unu doğru yansıtan kaynaklar.
Dezenformasyon (cluster tüketiyor) direct_rss / dom_scrape
Viral/dezenformasyon kaynakları — cluster bunları tüketiyor, VoxSim doğruluğunu onaylamıyor; sosyolojik gözlem olarak ölçülür.
Kritik metodolojik framing
VoxSim bilgi ekolojisi haritalaması yapar — cluster'ın TÜKETTİĞİ gerçeği ölçer, hangi gerçeğin doğru olduğuna karar vermez. Bu Sunstein, Bail ve Levy'nin akademik echo chamber çalışmalarının standart metodolojik çerçevelemesidir.
- ✓Disinformation tier içeriği VoxSim tarafından doğru olarak yayınlanmaz; "cluster bunları tüketiyor" sinyali olarak işlenir.
- ✓LLM prompt'una explicit kural enjekte edilir: "doğru argüman üretmiyorsun, bilgi ekolojisi haritalaması yapıyorsun".
- ✓Müşteri raporlarında ekolojik kompozisyon görsel olarak şeffaflıkla gösterilir (mainstream %X, echo chamber %Y, disinformation %Z).
Akademik referanslar: Sunstein, C. R. (2017) — Republic.com 2.0; Bail, C. (2021) — Breaking the Social Media Prism; Levy, R. (2021) — Social Media, News Consumption, and Polarization (American Economic Review).
İkincil eksen: demografik nüans (NUTS-2 × SES × KONDA)
Siyasi cluster'ın yanında ikincil bir eksen daha çalışır: demografik dağılım. Türkiye'nin yetişkin nüfusu üç bağımsız boyutta kesiştirilerek istatistiksel bir model oluşturulur: coğrafya (NUTS-2 bölgeleri), sosyo-ekonomik düzey (SES) ve kültürel-yaşam tarzı kümesi. Bu üç boyutun her kombinasyonu 26 × 4 × 3'lük matrisin bir hücresini oluşturur.
Her hücredeki sentetik ajanlar, kamuya açık demografik anketlerden ve nüfus sayımı verilerinden türetilmiş istatistiksel dağılımlar taşır. Hiçbir gerçek birey temsil edilmez; her ajan prosedürel olarak üretilmiş istatistiksel bir bileşimdir.
26
NUTS-2 coğrafi bölge
4
Sosyo-ekonomik düzey (AB · C1 · C2 · DE)
3
Kültürel-yaşam tarzı kümesi
Üç yaşam tarzı kümesi, Türkiye toplumunun laiklik, gelenek ve dindarlık konusundaki öz-tanımlama örüntülerine ilişkin araştırmaları yansıtır. Yaklaşık ulusal oranlar şöyledir:
Modern / Laik ~%34
Kentsel odaklı, dijital doğan, laik değer sistemi, yüksek eğitim yoğunluğu
Geleneksel Muhafazakâr ~%42
Anadolu kökleri, aile ve toplum odaklı, ılımlı dindarlık, hızlı değişime mesafeli
Dindar Muhafazakâr ~%24
Yüksek dindarlık, cemaat bağı güçlü, değer odaklı, doğu ve iç bölgelerde yoğun
Tarihsel olay kalibrasyonu
Bir simülasyon motoru yalnızca kalibrasyonu kadar iyidir. VoxSim popülasyon modelini, nesnel bir çıktının — seçim sonucu veya güvenilir anket verisi — gerçek ölçüm sağladığı tarihsel olaylara karşı doğrular. Bu süreç backtest kalibrasyonu olarak adlandırılır.
-
1
Tarihsel olayları derle
Her olay tarih, kategori, açık bir Türkçe açıklama ve Wikipedia, Resmî Gazete, haber arşivleri gibi kamuya açık kaynaklara yönlendiren URL ile belgelenir.
-
2
Ölçüm çıpası ata
Yalnızca nitelikli çıpası olan — ulusal seçim sonucu, güvenilir anket veya resmî istatistik — olaylar kalibrasyon setine girer. Bu, ayrıştırıcı ölçüttür.
-
3
Popülasyon simülasyonu çalıştır
Olay açıklaması simülasyon motoruna iletilir; motor tüm popülasyon hücrelerinde duygusal tepkiyi (öfke, korku, umut, ilgisizlik, destek) tahmin eder.
-
4
Gerçek ölçümle karşılaştır
Tahmin edilen dağılımlar çıpa ölçümüyle karşılaştırılır. Seçimlerde oy payı değişimleri segment düzeyi destek tahminlerine dönüştürülür; anket sorularında doğrudan duygu soruları doğrulama sağlar.
-
5
Yinele ve yeniden kalibre et
Sistematik sapmalar model yanlılıklarını ortaya koyar (örn. kırsal dindarlığın eksik ağırlıklandırılması). Parametreler ayarlanır ve kalibrasyon seti ortalama mutlak hata dengelenene kadar yeniden çalıştırılır.
Kalibrasyon için koşul katıdır: bir olay ancak yaklaşık altı ay içinde nitelikli bir ölçüm (seçim veya anket) bulunması durumunda sete dahil edilir. Bu kural, tahmin edilen toplumsal tepkinin bağımsız bir sinyalle karşılaştırılabilmesini sağlar.
Seçim sonuçları
1983'ten bu yana tüm seçimler için YSK sandık ve ulusal oy payı verileri
Anket araştırması
Güvenilir ulusal anket firmalarının yayımlanmış toplu sonuçları
Resmî istatistikler
TÜİK, TCMB ve diğer devlet kurumlarınca yayımlanan toplu veriler
Doğruluk skoru hesaplama
Her backtest çalışması olay bazında bir doğruluk tahmini üretir. VoxSim'de raporlanan genel doğruluk skoru, tüm kalibrasyon olaylarının olay güvenilirliğiyle ağırlıklandırılmış ortalamasıdır.
Doğruluk skoru formülü
Skor = 1 − OHO(tahmin_duygu, çıpa_duygu)
OHO = ortalama hatanın ortalaması; duygu boyutları (öfke, korku, umut, ilgisizlik, destek) ve popülasyon hücrelerinde hesaplanır
Skor konu kategorisine (ekonomik, siyasi, güvenlik vb.) göre ayrıştırılır; kullanıcılar modelin hangi politika alanlarında daha başarılı, hangilerinde daha zayıf olduğunu tam olarak görebilir. Her skor, onu üreten belirli olaylara geri bağlantı verir — kara kutu değil, tam şeffaflık.
Tarihsel olay kapsamı
Mevcut kalibrasyon seti, 1999'dan 2025'e uzanan 83 elle seçilmiş olay içerir. Segment düzeyi gerçek ölçüm verisinin daha zengin olduğu 2013 sonrası dönem kasıtlı olarak daha yoğun kapsamlıdır.
Önceki dönem olayları (2010 öncesi), anket arşivleri seyrek olduğundan birincil çıpa olarak seçim verilerini kullanır. 2013 sonrası olaylar, daha ayrıntılı segment bazlı gerçek ölçüm üretebilen daha zengin anket araştırmalarından yararlanır.
Çıpa kuralı
Kalibrasyon setindeki her olayın, olay tarihinden itibaren yaklaşık altı ay içinde nitelikli bir ölçüm çıpası vardır: seçim sonucu, ulusal anket veya resmî istatistik yayımı. Doğrulayıcı çıpası olmayan olaylar, tarihsel önemi ne kadar büyük olursa olsun kapsam dışı bırakılır. Bu kural doğruluk skorunu dürüst tutar.
Kalibrasyon seti sürekli genişletilmektedir. Her sürümde eklenen yeni olaylar değişiklik günlüğünde belirtilir. Hedef, ikinci yılın sonuna kadar 500'ü aşkın olaydir.
Bilinen sınırlamalar
VoxSim bir karar destek aracıdır, kehanet makinesi değil. Sınırlamaların açıkça aktarılması sorumlu kullanımın temelidir.
-
Sentetik ajanlar ≠ gerçek insanlar
Yanıtlar, gerçek vatandaşlardan değil istatistiksel ajanlardan gelir. Model bireysel hikayeleri, mikro-topluluk dinamiklerini veya anlık ruh hali değişimlerini yakalayamaz.
-
Kalibrasyon gecikmesi
Model parametreleri en son kalibrasyon döngüsünü yansıtır. Hızla gelişen durumlar — acil krizler, ani liderlik değişimleri — henüz yansıtılmamış olabilir.
-
Korelasyon, nedensellik değil
Yüksek öfke sinyali politikanızın bu öfkeye neden olduğu anlamına gelmez. Eş zamanlı başka faktörler tarihsel örüntüyü açıklıyor olabilir; model atıfı olaya yapar, bağlamsal dış etkenlere değil.
-
Kapsam boşlukları
1999 öncesi olayların anket çıpası yoktur ve kapsam dışıdır. Yalnızca belirli NUTS-2 bölgelerini etkileyen yerel olaylar toplu doğrulukta yetersiz temsil edilebilir.
-
LLM değişkenliği
Simülasyon çıktıları büyük dil modelleri tarafından üretilir ve tüm doğasında var olan LLM sınırlamalarını taşır: halüsinasyon riski, prompt ifadesine duyarlılık ve gerçek dünya anlayışı eksikliği.
İlk simülasyonunuzu çalıştırmaya hazır mısınız?
Crash Test modülüyle başlayın — sonuçlar 5 dakikadan kısa sürede.