Açık metodoloji

VoxSim nasıl çalışır?

Sentetik popülasyon modeli, tarihsel kalibrasyon ve doğruluk skoru — ticari sırları açıklamadan şeffaf bir anlatım.

01

Birincil eksen: 12 siyasi cluster + yankı odası

VoxSim simülasyonun birincil ekseninde demografi değil, siyasi eğilim vardır. Türkiye toplumu 12 siyasi cluster'a bölünür (sosyal demokrat, dindar muhafazakar, milliyetçi muhafazakar, kürt siyasi, genç kararsız, vb). Her cluster kendi yankı odasından beslenir.

Her cluster için ~10 lisanslı haber kaynağından 4 zaman penceresinde makale derlenir; LLM bu zaman-ağırlıklı külliyatı okuyup cluster'ın güncel zihinsel arka planını çıkarır (current_grievances, enduring_anxieties, narrative_frames). Söylem değerlendirmesi bu arka plana karşı yapılır.

12

siyasi cluster

10

lisanslı kaynak / cluster

4

zaman penceresi

Zaman-ağırlıklı hafıza eğrisi (forgetting curve)

Son 2 hafta
%50
Son 3 ay
%30
Son 6 ay
%15
Son 1 yıl
%5

Toplum yakını canlı hatırlar, uzağı soluk. Yakın gündem (son 2 hafta) %50 ağırlıkla, 1 yıllık arka plan %5 ağırlıkla snapshot'a girer — Ebbinghaus benzeri kademeli unutma.

Not: Kaynak isimleri (gazete, TV, podcast) ürün arayüzünde ve PDF raporlarında AÇIK YAZILMAZ — yalnızca codename (SOURCE_K1, SOURCE_M2, ...). Lisanslı aggregator (NewsAPI.ai / EventRegistry) kullanılır; custom scraping yapılmaz (EU AI Act provenance + ToS uyumu).

01.5

Bilgi ekolojisi haritalama (3-tier hibrit kaynak)

Mainstream haber kaynaklarının doğal kalite filtresi, bir cluster'ı tanımlayan bazı en kritik echo chamber kaynaklarını dışarıda bırakır. Yeni Akit, Veryansın TV, Mezopotamya Ajansı gibi yayıncılar küresel haber aggregator'larında yer almaz; ama dindar muhafazakar, ulusalcı sol veya kürt siyasi cluster'ının gerçek mood'unu mainstream kaynaklardan çok daha iyi açıklar.

VoxSim bu kör noktayı 3-tier hibrit yapı ile kapatır: lisanslı aggregator (mainstream) + yayıncı RSS feed'leri (niş + echo chamber) + son çare DOM scraping (RSS açmayan kritik kaynaklar için). Her makale acquisition_method × quality_tier matrisinde etiketlenir.

Anaakım doğrulanmış aggregator

Hürriyet, Sabah, Cumhuriyet gibi anaakım yayıncılar — fact-check standartı. Lisanslı aggregator (NewsAPI.ai/EventRegistry) üzerinden çekilir.

Niş doğrulanmış direct_rss / direct_license

Niş ama editorial standartı olan yayıncılar (Gazete Duvar, T24 vb.) — yayıncının kendi RSS feed'i veya direkt sözleşme.

Niş doğrulanmamış direct_rss

Küçük yayıncılar — doğrulanmamış ama cluster için sinyal verebilir.

Yankı odası direct_rss / dom_scrape

Cluster'a özgü ideolojik yayıncılar (Yeni Akit, Veryansın TV vb.) — cluster mood'unu doğru yansıtan kaynaklar.

Dezenformasyon (cluster tüketiyor) direct_rss / dom_scrape

Viral/dezenformasyon kaynakları — cluster bunları tüketiyor, VoxSim doğruluğunu onaylamıyor; sosyolojik gözlem olarak ölçülür.

Kritik metodolojik framing

VoxSim bilgi ekolojisi haritalaması yapar — cluster'ın TÜKETTİĞİ gerçeği ölçer, hangi gerçeğin doğru olduğuna karar vermez. Bu Sunstein, Bail ve Levy'nin akademik echo chamber çalışmalarının standart metodolojik çerçevelemesidir.

  • Disinformation tier içeriği VoxSim tarafından doğru olarak yayınlanmaz; "cluster bunları tüketiyor" sinyali olarak işlenir.
  • LLM prompt'una explicit kural enjekte edilir: "doğru argüman üretmiyorsun, bilgi ekolojisi haritalaması yapıyorsun".
  • Müşteri raporlarında ekolojik kompozisyon görsel olarak şeffaflıkla gösterilir (mainstream %X, echo chamber %Y, disinformation %Z).
Workspace opt-out: Karargah tier müşterileri saf mainstream-only veri istiyorlarsa Workspace settings'ten niş + dezenformasyon kaynaklarını kapsam dışı bırakabilirler.

Akademik referanslar: Sunstein, C. R. (2017) — Republic.com 2.0; Bail, C. (2021) — Breaking the Social Media Prism; Levy, R. (2021) — Social Media, News Consumption, and Polarization (American Economic Review).


02

İkincil eksen: demografik nüans (NUTS-2 × SES × KONDA)

Siyasi cluster'ın yanında ikincil bir eksen daha çalışır: demografik dağılım. Türkiye'nin yetişkin nüfusu üç bağımsız boyutta kesiştirilerek istatistiksel bir model oluşturulur: coğrafya (NUTS-2 bölgeleri), sosyo-ekonomik düzey (SES) ve kültürel-yaşam tarzı kümesi. Bu üç boyutun her kombinasyonu 26 × 4 × 3'lük matrisin bir hücresini oluşturur.

Her hücredeki sentetik ajanlar, kamuya açık demografik anketlerden ve nüfus sayımı verilerinden türetilmiş istatistiksel dağılımlar taşır. Hiçbir gerçek birey temsil edilmez; her ajan prosedürel olarak üretilmiş istatistiksel bir bileşimdir.

26

NUTS-2 coğrafi bölge

4

Sosyo-ekonomik düzey (AB · C1 · C2 · DE)

3

Kültürel-yaşam tarzı kümesi

Üç yaşam tarzı kümesi, Türkiye toplumunun laiklik, gelenek ve dindarlık konusundaki öz-tanımlama örüntülerine ilişkin araştırmaları yansıtır. Yaklaşık ulusal oranlar şöyledir:

Modern / Laik ~%34

Kentsel odaklı, dijital doğan, laik değer sistemi, yüksek eğitim yoğunluğu

Geleneksel Muhafazakâr ~%42

Anadolu kökleri, aile ve toplum odaklı, ılımlı dindarlık, hızlı değişime mesafeli

Dindar Muhafazakâr ~%24

Yüksek dindarlık, cemaat bağı güçlü, değer odaklı, doğu ve iç bölgelerde yoğun

Not: Tüm segment oranları kamuya açık toplu anket araştırmalarından türetilmiş sentetik yaklaşımlardır. VoxSim bireysel düzeydeki anket yanıtlayıcı verilerini barındırmaz veya işlemez.

03

Tarihsel olay kalibrasyonu

Bir simülasyon motoru yalnızca kalibrasyonu kadar iyidir. VoxSim popülasyon modelini, nesnel bir çıktının — seçim sonucu veya güvenilir anket verisi — gerçek ölçüm sağladığı tarihsel olaylara karşı doğrular. Bu süreç backtest kalibrasyonu olarak adlandırılır.

  1. 1

    Tarihsel olayları derle

    Her olay tarih, kategori, açık bir Türkçe açıklama ve Wikipedia, Resmî Gazete, haber arşivleri gibi kamuya açık kaynaklara yönlendiren URL ile belgelenir.

  2. 2

    Ölçüm çıpası ata

    Yalnızca nitelikli çıpası olan — ulusal seçim sonucu, güvenilir anket veya resmî istatistik — olaylar kalibrasyon setine girer. Bu, ayrıştırıcı ölçüttür.

  3. 3

    Popülasyon simülasyonu çalıştır

    Olay açıklaması simülasyon motoruna iletilir; motor tüm popülasyon hücrelerinde duygusal tepkiyi (öfke, korku, umut, ilgisizlik, destek) tahmin eder.

  4. 4

    Gerçek ölçümle karşılaştır

    Tahmin edilen dağılımlar çıpa ölçümüyle karşılaştırılır. Seçimlerde oy payı değişimleri segment düzeyi destek tahminlerine dönüştürülür; anket sorularında doğrudan duygu soruları doğrulama sağlar.

  5. 5

    Yinele ve yeniden kalibre et

    Sistematik sapmalar model yanlılıklarını ortaya koyar (örn. kırsal dindarlığın eksik ağırlıklandırılması). Parametreler ayarlanır ve kalibrasyon seti ortalama mutlak hata dengelenene kadar yeniden çalıştırılır.

Kalibrasyon için koşul katıdır: bir olay ancak yaklaşık altı ay içinde nitelikli bir ölçüm (seçim veya anket) bulunması durumunda sete dahil edilir. Bu kural, tahmin edilen toplumsal tepkinin bağımsız bir sinyalle karşılaştırılabilmesini sağlar.

Seçim sonuçları

1983'ten bu yana tüm seçimler için YSK sandık ve ulusal oy payı verileri

Anket araştırması

Güvenilir ulusal anket firmalarının yayımlanmış toplu sonuçları

Resmî istatistikler

TÜİK, TCMB ve diğer devlet kurumlarınca yayımlanan toplu veriler


04

Doğruluk skoru hesaplama

Her backtest çalışması olay bazında bir doğruluk tahmini üretir. VoxSim'de raporlanan genel doğruluk skoru, tüm kalibrasyon olaylarının olay güvenilirliğiyle ağırlıklandırılmış ortalamasıdır.

Doğruluk skoru formülü

Skor = 1 − OHO(tahmin_duygu, çıpa_duygu)

OHO = ortalama hatanın ortalaması; duygu boyutları (öfke, korku, umut, ilgisizlik, destek) ve popülasyon hücrelerinde hesaplanır

Skor konu kategorisine (ekonomik, siyasi, güvenlik vb.) göre ayrıştırılır; kullanıcılar modelin hangi politika alanlarında daha başarılı, hangilerinde daha zayıf olduğunu tam olarak görebilir. Her skor, onu üreten belirli olaylara geri bağlantı verir — kara kutu değil, tam şeffaflık.

≥ 85%
Yüksek güven Tahminler çıpa ölçümlerine yakın; karar desteği için güvenilir
70–84%
Orta güven Bazı hücrelerde belirgin sapma; çıktıyı kesin değil yönsel olarak değerlendir
< 70%
Düşük güven Önemli model yanlılığı tespit edildi; kalibrasyon devam ediyor
Doğruluk skoru modelin sonucu bilinen geçmiş olayları ne kadar iyi tahmin ettiğini yansıtır. Gelecekteki tahmin performansını garanti etmez. Toplumsal dinamikler değişir — model, yeni kalibrasyon verisi sunuldukça güncellenir.

05

Tarihsel olay kapsamı

Mevcut kalibrasyon seti, 1999'dan 2025'e uzanan 83 elle seçilmiş olay içerir. Segment düzeyi gerçek ölçüm verisinin daha zengin olduğu 2013 sonrası dönem kasıtlı olarak daha yoğun kapsamlıdır.

14 Seçim sonucu
22 Ekonomik olay
18 Siyasi olay
12 Kriz ve afet
8 Dış politika
8 Sosyal ve eğitim

Önceki dönem olayları (2010 öncesi), anket arşivleri seyrek olduğundan birincil çıpa olarak seçim verilerini kullanır. 2013 sonrası olaylar, daha ayrıntılı segment bazlı gerçek ölçüm üretebilen daha zengin anket araştırmalarından yararlanır.

Çıpa kuralı

Kalibrasyon setindeki her olayın, olay tarihinden itibaren yaklaşık altı ay içinde nitelikli bir ölçüm çıpası vardır: seçim sonucu, ulusal anket veya resmî istatistik yayımı. Doğrulayıcı çıpası olmayan olaylar, tarihsel önemi ne kadar büyük olursa olsun kapsam dışı bırakılır. Bu kural doğruluk skorunu dürüst tutar.

Kalibrasyon seti sürekli genişletilmektedir. Her sürümde eklenen yeni olaylar değişiklik günlüğünde belirtilir. Hedef, ikinci yılın sonuna kadar 500'ü aşkın olaydir.


06

Bilinen sınırlamalar

VoxSim bir karar destek aracıdır, kehanet makinesi değil. Sınırlamaların açıkça aktarılması sorumlu kullanımın temelidir.

  • Sentetik ajanlar ≠ gerçek insanlar

    Yanıtlar, gerçek vatandaşlardan değil istatistiksel ajanlardan gelir. Model bireysel hikayeleri, mikro-topluluk dinamiklerini veya anlık ruh hali değişimlerini yakalayamaz.

  • Kalibrasyon gecikmesi

    Model parametreleri en son kalibrasyon döngüsünü yansıtır. Hızla gelişen durumlar — acil krizler, ani liderlik değişimleri — henüz yansıtılmamış olabilir.

  • Korelasyon, nedensellik değil

    Yüksek öfke sinyali politikanızın bu öfkeye neden olduğu anlamına gelmez. Eş zamanlı başka faktörler tarihsel örüntüyü açıklıyor olabilir; model atıfı olaya yapar, bağlamsal dış etkenlere değil.

  • Kapsam boşlukları

    1999 öncesi olayların anket çıpası yoktur ve kapsam dışıdır. Yalnızca belirli NUTS-2 bölgelerini etkileyen yerel olaylar toplu doğrulukta yetersiz temsil edilebilir.

  • LLM değişkenliği

    Simülasyon çıktıları büyük dil modelleri tarafından üretilir ve tüm doğasında var olan LLM sınırlamalarını taşır: halüsinasyon riski, prompt ifadesine duyarlılık ve gerçek dünya anlayışı eksikliği.

İlk simülasyonunuzu çalıştırmaya hazır mısınız?

Crash Test modülüyle başlayın — sonuçlar 5 dakikadan kısa sürede.