VoxSim nasıl çalışır?
VoxSim'in çalışma mantığını, doğrulama yöntemlerini ve sınırlamalarını açık bir dille anlatan metodoloji rehberi.
Birincil eksen: 12 siyasi küme + yankı odası
VoxSim simülasyonun birincil ekseninde demografi değil, siyasi eğilim vardır. Türkiye toplumu 12 siyasi kümeye bölünür (sosyal demokrat, dindar muhafazakar, milliyetçi muhafazakar, kürt siyasi, genç kararsız, vb). Her küme kendi yankı odasından beslenir.
Her küme için haber kaynakları dört zaman penceresinde taranır; yapay zeka bu zaman-ağırlıklı haber ortamını okuyarak kümenin şu anki ruh halini, şikayetlerini ve baskın anlatı çerçevelerini çıkarır. Söylem değerlendirmesi bu canlı bağlama karşı yapılır.
Her kümenin gösterilen nüfus payı (%oran), ulusal kamuoyu araştırmaları ve seçim verilerinden elde edilen çapraz tablo tahminlerine dayanır. Türkiye'nin lider bağımsız kamuoyu araştırma kuruluşundan türetilmiş yaşam tarzı tipolojisi (LKA takma adıyla anılır) bu tahminlerin temel çerçevesini oluşturur. Kaynak kuruluşun ticari veri lisansı kapsamında ismi gizli tutulur; ham tablolar yeniden yayınlanmaz, yalnızca istatistiksel çıkarım aktarılır.
12
siyasi küme
10
haber kaynağı / küme
4
zaman penceresi
Bourdieu 3-Kapital × KONDA Alt-tipoloji
Her küme için Bourdieu (Distinction, 1984) 3-kapital teorisi (ekonomik · kültürel · sosyal) ve KONDA Ekim 2024 alt-tipolojisi uygulandı. Tablo; kümelerin toplumdaki konum ve eğilimlerini özetler; bireysel profil değildir. Bu sermaye haritası yapay zekanın Türkiye bağlamına özgü siyasi davranış modellemesini güçlendirir.
| Küme | Ekonomik | Kültürel | Sosyal | KONDA Alt-tip |
|---|---|---|---|---|
| ulusalci_sol | 3 | 4 | 4 | Modern Seküler |
| sosyal_demokrat | 4 | 5 | 4 | Modern |
| liberal_kentli | 5 | 5 | 3 | Liberal Modern |
| merkez_sag | 3 | 3 | 4 | Muhafazakar Modern |
| dindar_muhafazakar | 3 | 3 | 5 | Dindar Muhafazakar |
| islamci_taban | 2 | 3 | 5 | Dini Muhafazakar |
| milliyetci_muhafazakar | 2 | 3 | 4 | Geleneksel Muhafazakar |
| iyi_parti_merkez | 4 | 4 | 3 | Liberal Muhafazakar |
| kurt_siyasi | 2 | 3 | 5 | Geleneksel-Etnik |
| genc_kararsiz | 2 | 4 | 2 | Modern Genç |
| kentli_kararsiz | 3 | 4 | 2 | Modern |
| anadolu_kararsiz | 2 | 2 | 4 | Geleneksel Muhafazakar |
1 = çok düşük, 5 = çok yüksek. Lacivert tonları yüksek sermaye, amber tonları düşük sermaye.
Akademik referanslar: Bourdieu (1984) — Distinction: A Social Critique of the Judgement of Taste (Harvard UP); Çarkoğlu & Kalaycıoğlu (2021) — Fragile but Resilient? Turkish Electoral Dynamics, 2002–2015 (U. Michigan Press); Çarkoğlu & Kalaycıoğlu (2020) — Elections and Public Opinion in Turkey (Routledge); Çarkoğlu & Toprak (2007) — Religion, Society and Politics in a Changing Turkey (TESEV).
12 siyasi kümeyi keşfedin
Her kümenin profil, bilgi ekolojisi, dönen anlatılar ve haftalık snapshot geçmişi.
Bilgi ekolojisi haritalama (3-tier hibrit kaynak)
Büyük haber ajanslarının doğal kalite filtresi, bir kümeyi gerçekten tanımlayan bazı kritik kaynakları dışarıda bırakır. Niş yayıncılar — özellikle ideolojik odaklı medya organları — küresel kataloglarda yer almaz; ama belirli siyasi kümelerin gerçek ruh halini ve kaygılarını anaakım kaynaklardan çok daha iyi yansıtır.
VoxSim bu boşluğu hibrit kaynak yapısıyla kapatır: yayıncıların kendi RSS akışları üzerinden derlenen çok katmanlı bir haber tabanı oluşturulur (anaakım + niş + yankı odası). Her içerik parçası kaynak kalitesi ve tipi bakımından sınıflandırılır.
Anaakım doğrulanmış
Geniş okuyucu kitlesine sahip büyük haber kuruluşları — editoryal standartı yüksek, içerik doğrulama süreçleri yerleşik.
Niş doğrulanmış
Belirli bir kitleye hitap eden, editoryal standartlarını koruyan niş yayıncılar.
Niş doğrulanmamış
Küçük yayıncılar — doğrulanmamış ama küme için sinyal verebilir.
Yankı odası
Belirli bir siyasi kümenin iç dünyasını yansıtan ideolojik yayıncılar — kümenin gerçek ruh halini okumak için kritik kaynaklar.
Dezenformasyon (küme tüketiyor)
Dezenformasyon örüntüsü taşıyan kaynaklar — VoxSim bu içeriklerin doğruluğunu onaylamaz; yalnızca kümenin neyi tükettiğini sosyolojik bir gözlem olarak ölçer.
Önemli metodoloji notu
VoxSim bilgi ekolojisi haritalaması yapar — kümenin TÜKETTİĞİ gerçeği ölçer, hangi gerçeğin doğru olduğuna karar vermez. Bu Sunstein, Bail ve Levy'nin akademik echo chamber çalışmalarının standart metodolojik çerçevelemesidir.
- ✓Disinformation tier içeriği VoxSim tarafından doğru olarak yayınlanmaz; "küme bunları tüketiyor" sinyali olarak işlenir.
- ✓Yapay zekaya açık bir yönerge verilir: görev doğrulama değil, bilgi ekolojisi haritalama.
- ✓Müşteri raporlarında ekolojik kompozisyon görsel olarak şeffaflıkla gösterilir (mainstream %X, echo chamber %Y, disinformation %Z).
Akademik referanslar: Sunstein (2017) — #Republic: Divided Democracy in the Age of Social Media (Princeton UP); Bail (2021) — Breaking the Social Media Prism (Princeton UP); Levy (2021) — Social Media, News Consumption, and Polarization (American Economic Review); Cinelli et al. (2021) — The Echo Chamber Effect on Social Media (PNAS); Bakshy, Messing & Adamic (2015) — Exposure to Ideologically Diverse News on Facebook (Science); Garrett (2009) — Echo Chambers Online? Selective Exposure Among Internet News Users (JCMC).
Günlük yankı odası pipeline'ı
Her kümenin snapshot'ı her gece dört aşamalı pipeline ile yeniden inşa edilir. Toplam süre ≈ 30 dakika; 02:30–03:30 İstanbul saatleri arasında çalışır. Gün içindeki simülasyonlar her zaman bir önceki geceye ait context okur. Önemli kısıt: gün içinde patlak veren anlık krizler, aynı gece pipeline'ı tamamlanana kadar snapshot'a dahil değildir — Modül B bu durumda Olay Enjeksiyonu (Modül E, Karargah+) ile tamamlanmalıdır.
Gece çalışma akışı (Istanbul saatiyle)
Makale ingest
Yayıncıların kendi RSS feed'leri (mainstream + niche). Kaynak başına son ~2 gün makale.
02:30 TR · gece boyu otomatik çalışır
Makale başına özet
Her makale ≤200 kelimelik yapılandırılmış özete dönüştürülür. Orijinal metin saklanmaz.
02:45 TR · LLM çıkarım aşaması
Vektör embedding
Başlık + özet → yüksek boyutlu semantik vektör. Semantik arama ve küme centroid hesabı için kullanılır.
02:50 TR · semantik indeksleme
Küme snapshot rebuild
Küme başına: zaman-ağırlıklı özet örneklemesi → LLM ruh hali, şikayetler ve lexicon kompoze eder.
03:00 TR · 12 küme · gece snapshot
Aşamalar paralel çakışmayı önleyen kilitle sıralı çalışır. Bir aşama başarısız olursa sonraki yine de dünkü veriyle çalışır — sessiz bozulma yok.
Üstel unutma eğrisi (w = exp(−t/τ))
Her makaleye yaşına göre <strong>w(t) = exp(−t / τ)</strong> ağırlığı verilir; bucket ağırlıkları bu eğrinin pencere sınırları üzerindeki integralinden deterministik olarak türetilir. τ (tau) zaman sabiti tek doğruluk kaynağıdır — yarı-ömür τ·ln(2). Murre & Dros (2015 PLOS ONE) Ebbinghaus replikasyonu ve Wu et al. (2007 PNAS) haber dikkat decay literatürüne dayanır.
Bucket ağırlıkları aşağıda canlı hesaplanır — config değiştirildiğinde otomatik güncellenir. LLM'e makale-bazlı ağırlık olarak da iletilir; bucket'lar yalnızca input bütçesi (token kotası) için kullanılır.
Kaynak anonimliği
Tüm public yüzeyler — config dosyaları, API yanıtları, PDF raporlar, audit log'lar, bu sayfa — haber kaynaklarını yalnızca codename ile gösterir (örn. SOURCE_K1, SOURCE_M3). Gerçek kaynak URI mapping'i sadece Talivio compliance ekibinin erişebildiği şifreli bir dosyada bulunur.
Public (kod, log, rapor)
SOURCE_K1, SOURCE_M2, SOURCE_D5, …
Codename'ler taxonomy versiyonları arasında kararlı — müşteri dashboard kurabilir.
Şifreli mapping
[encrypted · ops-only]
Gerçek yayın URI'leri. Rotation politikası + her okumada erişim audit.
Backtest temporal pin
VoxSim tarihsel bir olayı simüle ettiğinde (örn. Şubat 2023 depremi), bugünün küme snapshot'ını kullanmak yanıltıcı olur — 2023'te kümelerin inançları farklıydı. Backtest, event_date tarihinde veya öncesinde aktif olan snapshot versiyonunu seçer.
Snapshot'lar append-only
Eski snapshot'lar asla overwrite edilmez. 2024-09 olayı için bir simülasyon 2024-09-15 snapshot'ını okur, en güncelini değil. Bu Doğruluk Skoru kalibrasyonunu dürüst kılar — bir kümenin geçmiş inançlarını retroaktif olarak "düzeltme" hakkımız yok.
Günlük güncelleme maliyeti
Günlük yankı odası güncellemesi minimum maliyetle çalışır: RSS içerik toplama tamamen ücretsiz; yapay zeka işleme gideri ise simülasyon başına değil, 12 küme için sabit günlük bütçe içinde kalır. Bu mimari, platform sürdürülebilirliğini garanti eder.
Akademik referanslar: Murre & Dros (2015) — Replication and Analysis of Ebbinghaus' Forgetting Curve (PLOS ONE); Tversky & Kahneman (1973) — Availability: A Heuristic for Judging Frequency and Probability (Cognitive Psychology).
İkincil eksen: demografik nüans
Siyasi kümenin yanında ikincil bir eksen daha çalışır: demografik dağılım. Türkiye'nin yetişkin nüfusu üç bağımsız boyutta kesiştirilerek istatistiksel bir model oluşturulur: coğrafya (NUTS-2 bölgeleri), sosyo-ekonomik düzey (SES) ve kültürel-yaşam tarzı kümesi. Bu üç boyutun her kombinasyonu 26 × 4 × 3'lük matrisin bir hücresini oluşturur.
Her hücredeki sentetik ajanlar, kamuya açık demografik anketlerden ve nüfus sayımı verilerinden türetilmiş istatistiksel dağılımlar taşır. Hiçbir gerçek birey temsil edilmez; her ajan prosedürel olarak üretilmiş istatistiksel bir bileşimdir.
26
NUTS-2 coğrafi bölge
4
Sosyo-ekonomik düzey (AB · C1 · C2 · DE)
3
Kültürel-yaşam tarzı kümesi
Üç yaşam tarzı kümesi, Türkiye toplumunun laiklik, gelenek ve dindarlık konusundaki öz-tanımlama örüntülerine ilişkin araştırmaları yansıtır. Yaklaşık ulusal oranlar şöyledir: (Veriler: TÜİK ADNKS ve KONDA Yaşam Tarzı Araştırması).
Modern / Laik ~%34
Kentsel odaklı, dijital doğan, laik değer sistemi, yüksek eğitim yoğunluğu
Geleneksel Muhafazakâr ~%42
Anadolu kökleri, aile ve toplum odaklı, ılımlı dindarlık, hızlı değişime mesafeli
Dindar Muhafazakâr ~%24
Yüksek dindarlık, cemaat bağı güçlü, değer odaklı, doğu ve iç bölgelerde yoğun
Akademik referanslar: Beckman, Baggerly & McKay (1996) — Creating Synthetic Baseline Populations (Transportation Research A); Müller & Axhausen (2011) — Hierarchical IPF: A Synthetic Population for Switzerland (ERSA); Park et al. (2023) — Generative Agents: Interactive Simulacra of Human Behavior (UIST); Argyle et al. (2023) — Out of One, Many (Political Analysis); Aher, Arriaga & Kalai (2023) — Using LLMs to Simulate Multiple Humans (ICML).
Tarihsel olay kalibrasyonu
Bir simülasyon motoru yalnızca kalibrasyonu kadar iyidir. VoxSim popülasyon modelini, nesnel bir çıktının — seçim sonucu veya güvenilir anket verisi — gerçek ölçüm sağladığı tarihsel olaylara karşı doğrular. Bu süreç backtest kalibrasyonu olarak adlandırılır.
-
1
Tarihsel olayları derle
Her olay tarih, kategori, açık bir Türkçe açıklama ve Wikipedia, Resmî Gazete, haber arşivleri gibi kamuya açık kaynaklara yönlendiren URL ile belgelenir.
-
2
Referans verisini belirle
Yalnızca nitelikli referans ölçümü olan — ulusal seçim sonucu, güvenilir anket veya resmî istatistik — olaylar kalibrasyon setine girer. Bu, ayrıştırıcı ölçüttür.
-
3
Popülasyon simülasyonu çalıştır
Olay açıklaması simülasyon motoruna iletilir; motor tüm popülasyon hücrelerinde duygusal tepkiyi (öfke, korku, umut, ilgisizlik, destek) tahmin eder.
-
4
Gerçek ölçümle karşılaştır
Tahmin edilen dağılımlar çıpa ölçümüyle karşılaştırılır. Seçimlerde oy payı değişimleri segment düzeyi destek tahminlerine dönüştürülür; anket sorularında doğrudan duygu soruları doğrulama sağlar.
-
5
Yinele ve yeniden kalibre et
Sistematik sapmalar model yanlılıklarını ortaya koyar (örn. kırsal dindarlığın eksik ağırlıklandırılması). Parametreler ayarlanır ve kalibrasyon seti ortalama mutlak hata dengelenene kadar yeniden çalıştırılır.
Kalibrasyon için koşul katıdır: bir olay ancak yaklaşık altı ay içinde nitelikli bir ölçüm (seçim veya anket) bulunması durumunda sete dahil edilir. Bu kural, tahmin edilen toplumsal tepkinin bağımsız bir sinyalle karşılaştırılabilmesini sağlar.
Seçim sonuçları
1983'ten bu yana tüm seçimler için YSK sandık ve ulusal oy payı verileri
Anket araştırması
Güvenilir ulusal anket firmalarının yayımlanmış toplu sonuçları
Resmî istatistikler
TÜİK, TCMB ve diğer devlet kurumlarınca yayımlanan toplu veriler
Akademik referanslar: Brier (1950) — Verification of Forecasts (Monthly Weather Review); Tetlock (2005) — Expert Political Judgment (Princeton UP); Hyndman & Koehler (2006) — Forecast accuracy measures; Gneiting & Raftery (2007) — Strictly Proper Scoring Rules (JASA).
Doğruluk skoru hesaplama
Her backtest çalışması olay bazında bir doğruluk tahmini üretir. VoxSim'de raporlanan genel doğruluk skoru, tüm kalibrasyon olaylarının olay güvenilirliğiyle ağırlıklandırılmış ortalamasıdır.
Doğruluk metrikleri (4 skor yan yana raporlanır)
Brier (1950) ve Log-skor (Gneiting-Raftery 2007), istatistiksel olarak katı tahmin değerlendirme ölçütleridir (proper scoring rules); normalize edilmiş duygu dağılımı üzerinde hesaplanır. CRPS (Gneiting-Raftery 2007), sürekli dağılımlar için ek bir katı ölçüttür. MAE ve Doğruluk (1−MAE/100) geriye uyumluluk için korunmaktadır.
Skor konu kategorisine (ekonomik, siyasi, güvenlik vb.) göre ayrıştırılır; kullanıcılar modelin hangi politika alanlarında daha başarılı, hangilerinde daha zayıf olduğunu tam olarak görebilir. Her skor, onu üreten belirli olaylara geri bağlantı verir — kara kutu değil, tam şeffaflık.
Güncellenmiş metodoloji (üstel unutma eğrisi + Bourdieu kapital profili + Türkçe örnek davranış kalıpları) ile yapılan 46 olaylık tam A/B testi: ağırlıklı doğruluk %81.84, ortalama mutlak hata 18.16. Önceki metodoloji 50 olaylık testte %62.31 idi. Toplam fark: +19.53 puan. Adil karşılaştırma (aynı 6 olay): %80.94 → %82.60 = +1.66 puan, 6 olayın 4'ünde iyileşme.
%81.84
Faz 1.8 (46 olay)
%62.31
Faz 1.5/1.6 (50 olay)
+1.66 pp
same-events (6)
Akademik referanslar: Willmott & Matsuura (2005) — Advantages of MAE over RMSE (Climate Research); Hyndman & Koehler (2006) — Another look at measures of forecast accuracy (Int'l J. Forecasting); Gneiting & Raftery (2007) — Strictly Proper Scoring Rules (JASA).
Tarihsel Kalibrasyon — 3 Seçim Çıpası (2015–2023)
VoxSim'in 12 küme modeli, gerçek YSK seçim sonuçlarına karşı bağımsız olarak doğrulanmıştır. Her kümenin tarihsel oy dağılımı nüfus paylarıyla ağırlıklandırılarak ulusal tahmine dönüştürülür; gerçek seçim sonuçlarından sapma matematiksel olarak hesaplanır. Aşağıdaki üç çapa (2015 Kasım, 2018, 2023) bütünleşik sağlık skorunu üretir.
2002 Milletvekili
88/100
2007 Milletvekili
94/100
2011 Milletvekili
94/100
2015 Haziran Milletvekili
98/100
2015 Kasım Milletvekili
100/100
2018 Milletvekili
99/100
2023 Milletvekili
98/100
2024 Yerel Seçim
98/100
KOMPOZİT SKOR 96/100 (Yüksek güven)
3 seçim ortalamasıdır. Yüksek skor (≥85), küme modeliinin tek seçime over-fit olmadığını ve siyasi dönemler arasında robust kaldığını gösterir.
Tahmin kalitesi kırılımı
proper0.0003
Brier
1.695
Log-score
0.009
RMSE
Brier (1950) + Log-score (Gneiting-Raftery 2007) strictly proper. RMSE point-prediction proper. calibration_score TVD-tabanlı (gevşek-proper).
Skorlar her gün otomatik olarak yeniden hesaplanır; model parametreleri güncellendiğinde anlık olarak yansıtılır. Bu hesaplamalar yapay zeka çağrısı gerektirmez — tamamen deterministik matematiksel işlemlerdir.
Türkiye siyasi kırılma noktaları (2015 — günümüz)
Kalibrasyon ankorlarının arkasındaki olay zinciri: seçimler, yargı kararları, ekonomik şoklar — kaynaklı kronoloji.
Replikasyon varyansı & algoritmik sadakat
Referans alınan iki temel akademik uyarıya karşı sisteme koruma katmanları eklendi. Aşağıdaki her iki test de canlı veri üzerinden çalışır.
Prompt kararsızlığı — Bisbee (2024) replikasyon taraması
Bisbee ve ark. (2024), Political Analysis dergiside şu uyarıyı yapar: yapay zeka tabanlı sentetik anketler aynı soruyu farklı söyleyişle test edildiğinde tutarsız sonuçlar üretir; tek bir çıktıya güvenmek yanıltıcıdır. VoxSim her şablon için 5 kez tekrar ölçümü yapar, varyans katsayısını hesaplar ve üç kararlılık bandına ayırır: kararlı / orta / kararsız.
| Şablon | Bağlam | N | CV | Stabilite |
|---|---|---|---|---|
| synthetic_poll | anadolu_kararsiz | 0 | 0.0000 | no_data |
| synthetic_poll | iyi_parti_merkez | 0 | 0.0000 | no_data |
| synthetic_poll | sosyal_demokrat | 0 | 0.0000 | no_data |
Algoritmik sadakat — Argyle (2023)
Argyle ve ark. (2023) merkezi önerisi: sentetik popülasyon modelinin demografik altgrupları gerçek alan araştırması bulgularıyla tutarlı biçimde temsil etmesi zorunludur. VoxSim'de 12 küme tahmini, 3 yaşam tarzı segmentine (modern / geleneksel / dindar) toplanarak yayımlanmış KONDA Barometre çapraz tablolarıyla karşılaştırılır. Sadakat skoru 1.0 = mükemmel örtüşme, 0.0 = tam ayrışma anlamına gelir.
2023
0.767
HIGH · 3 seg
2018
0.761
HIGH · 3 seg
2024_local
0.806
HIGH · 3 seg
Segment bazında ayrıntılı tablo
2023
modern
0.842
gelenekci
0.690
dindar
0.770
2018
modern
0.807
gelenekci
0.654
dindar
0.823
2024_local
modern
0.927
gelenekci
0.677
dindar
0.813
Kültürel önyargı azaltımı — Atari (2023)
Atari ve ark. (2023) bulgusu: büyük dil modelleri, Batı/kentsel/yüksek gelirli toplumlar dışındaki kültürlerde (kolektivist yapılar dahil) sistematik önyargı gösteriyor. Türkiye bu risk grubuna girer. Azaltım yöntemi: 12 küme için 36 Türkçe örnek davranış kalıbı (yalnızca YSK + KONDA agregat verisi; bireysel profil değil) yapay zekaya örnekler olarak gösterilir. Bu sayede modelin siyasi yorum ve oy gerekçelendirmesi Türkiye bağlamına kalibre olur.
12
Cluster
36
Örnek
Not
Sentetik anket ve söylem testi sorgularına otomatik olarak eklenir. Yapay zekanın Türkiye bağlamına özgü yorumunu güçlendirir; PDF çıktısına yansımaz.
Akademik referanslar: Bisbee et al. (2024) — Synthetic Replacements for Human Survey Data? The Perils of LLMs (Political Analysis); Argyle et al. (2023) — Out of One, Many: Using LLMs to Simulate Human Samples (Political Analysis).
Tarihsel olay kapsamı
Mevcut kalibrasyon seti, 1999'dan 2025'e uzanan 130 elle seçilmiş olay içerir. Segment düzeyi gerçek ölçüm verisinin daha zengin olduğu 2013 sonrası dönem kasıtlı olarak daha yoğun kapsamlıdır.
Modül D (Backtest) ve Modül K (Sentetik Anket) kalibrasyonu, 2001 ekonomik krizinden bugüne 25 yıllık politik döngüye dayanır. Şubat 2001 krizi, 2002 AKP doğuşu, 2007 e-muhtıra, 2010 anayasa referandumu, 2013 Gezi olayları, 2016 darbe girişimi, 2018 lira krizi, 2020 COVID, 2023 Kahramanmaraş depremi, 2025 İmamoğlu süreci dahil 67 büyük olay için 12 küme × 5 duygu (öfke, korku, apati, umut, destek) gerçek tepki dağılımı kayıtlı.
2001
Başlangıç
25 yıl
Kapsam
7
Seçim çıpası
2014 öncesi dönem, günümüz küme yapısıyla geriye yansıtılmıştır — bu olaylar "eski dönem" olarak etiketlenir. 2014 sonrası küme davranışı doğrudan ölçülmüştür; kalibrasyon bütünleşik skoru yüksek bant içindedir.
Önceki dönem olayları (2010 öncesi), anket arşivleri seyrek olduğundan birincil çıpa olarak seçim verilerini kullanır. 2013 sonrası olaylar, daha ayrıntılı segment bazlı gerçek ölçüm üretebilen daha zengin anket araştırmalarından yararlanır.
Referans Veri Kuralı
Kalibrasyon setindeki her olayın, olay tarihinden itibaren yaklaşık altı ay içinde nitelikli bir referans ölçümü vardır: seçim sonucu, ulusal anket veya resmî istatistik yayımı. Doğrulayıcı referansı olmayan olaylar, tarihsel önemi ne kadar büyük olursa olsun kapsam dışı bırakılır. Bu kural doğruluk skorunu şeffaf ve güvenilir tutar.
Kalibrasyon seti sürekli genişletilmektedir. Her sürümde eklenen yeni olaylar değişiklik günlüğünde belirtilir. Hedef, ikinci yılın sonuna kadar 500'ü aşkın olaydir.
Akademik referanslar: King & Lowe (2003) — Automated Information Extraction for Conflict Data (International Organization); Schrodt (2012) — Precedents, Progress & Prospects in Political Event Data (Int'l Interactions); Boschee et al. (2015) — ICEWS Coded Event Data (Harvard Dataverse); Leetaru & Schrodt (2013) — GDELT: Global Data on Events, Location and Tone.
Pazar Sinyal Profili
Karargah · Karargah+Modül K, 26 NUTS-2 bölge × 4 SES × 3 yaşam tarzı = 312 demografik hücre için bağımsız LLM dağılım tahmini üretir ve bunları nüfus paylarıyla birleştirerek ulusal parti pay tahmini döndürür. Her hücre kendi coğrafi/sosyo-ekonomik/kültürel profili ile sorulur. "Şu an seçim olsa ne olur?" sorusuna sentetik nüfus simülasyonu bazlı bir karar destek sinyali sunar; kamuoyu yoklaması değil, stratejik iç değerlendirme aracıdır.
-
1
Küme bazlı paralel analiz
Her demografik dilim — coğrafya, sosyo-ekonomik düzey ve yaşam tarzına göre tanımlanan segmentler — ayrı bir analiz oturumunda değerlendirilir. Yapay zeka her segmentin bölgesel siyasi profilini, geçmiş seçim eğilimlerini ve kültürel bağlamını göz önünde bulundurarak tahmin üretir.
-
2
Hatırlama kalibrasyonu
Her hücreden 2023, 2018 ve 2015 Kasım Milletvekili hatırlama dağılımları da istenir. Ağırlıklı ulusal aggregate YSK resmî sonuçlarıyla karşılaştırılarak composite kalibrasyon skoru üretilir. Hatırlama bir düzeltici değil, model kalitesinin göstergesidir — geçmiş sonuca doğru çekim yapmaz.
-
3
Nüfus ağırlıklı ulusal birleştirme
Tüm segment çıktıları nüfus paylarıyla ağırlıklandırılarak ulusal tabloya dönüştürülür. Segment içi göreceli sıralama korunurken ulusal toplam, tarihsel seçim çıpalarına yakınsaması için matematiksel olarak ayarlanır. Geçersiz veya eksik dönen segmentler otomatik olarak kapsam dışı tutulur.
7
seçim çıpası
25+
yıllık tarihsel kapsam
Kamuoyu yoklaması değildir
Modül K çıktısı kamuya anket olarak yayınlanamaz; karar destek sinyalidir. YSK kanunu uyarınca yaklaşan seçime 10 günden az süre kaldığında otomatik devre dışı kalır. Sentetik nitelik, kullanıcı tarafından her çalıştırmada onaylanır.
05.5b — Cumhurbaşkanlığı varyantı
Karargah · Karargah+CB seçimi 2-tur sentetik sinyali
Cumhurbaşkanlığı varyantı, aday-bazlı 2-tur dağılım için çalışır. 12 siyasi küme, 5 sabit aday rolü (iktidardaki aday, ana muhalefet, Kürt siyasi cephe, milliyetçi alternatif, dindar sağ) bağlamında analiz edilir. Müşteri ekipleri aday görüntü adlarını kendi seçimlerine göre özelleştirebilir.
- • R1'de %50 geçilmediyse otomatik R2 hesabı (R2 her zaman hipotetik olarak doldurulur; aggregator karar verir).
- • Kalibrasyon: 2018 R1, 2023 R1 ve 2023 R2 YSK resmî seçim sonuçları. Model kalibrasyon skoru yüksek bant içinde.
- • 2028 aday belirsizliği gözetilerek model esnekliği korunur; müşteri ekipleri tanınan aday isimlerini sisteme girebilir.
⚠ MV anketinin tüm etik bekçi'si CB varyantında aynen geçerli: kamu CB anketi DEĞİLDİR, filigran zorunlu, T-10 yasak penceresi, PDF 30 gün expiry, recall sadece kalibrasyon.
05.5c — Yerel (Belediye) varyantı
Karargah · Karargah+Belediye başkanlığı il bazlı sentetik sinyali
Belediye başkanlığı varyantı, il bazında (NUTS-3, 81 il) yerel seçim analizi sunar. 12 ulusal siyasi küme, 6 sabit aday rolüyle (mevcut başkan, ana muhalefet, Kürt siyasi, milliyetçi alternatif, dindar sağ, bağımsız-yerel) kesiştirilir. Kümelerin ulusal ağırlıkları korunur; yapay zeka her kümenin il bağlamına özgü davranışını tahmin eder.
- • İl seçimi (plaka 01..81) zorunlu. Her prompt'a il adı, bölge, tier (büyükşehir/il) ve (varsa) anchor verisi enjekte edilir.
- • TEK TUR — yerel seçimlerde R2 yok. En yüksek geçerli oy alan aday kazanır. Marj (1.−2.) ayrıca raporlanır.
- • Kalibrasyon: 2019 + 2024 YSK yerel sonuçları (30 il YSK doğrudan, 51 il TR Wikipedia/YSK alıntısı). Tüm 81 il için kalibrasyon skoru üretilir; düşük güvenli iller config'te UNCERTAIN olarak işaretlidir.
- • İl bazlı küme payları sabit kalır; çıktı '12 küme perspektifinden il X fotoğrafı' olarak yorumlanmalıdır. Bu, yetersiz yerel veri sorununu aşmak için bilinçli bir tasarım tercihidir.
⚠ MV anketinin tüm etik bekçi'si yerel varyantta aynen geçerli: kamu yerel anketi DEĞİLDİR, filigran zorunlu, T-10 yasak penceresi, PDF 30 gün expiry, recall sadece kalibrasyon.
Akademik referanslar: Argyle et al. (2023) — Out of One, Many: Using Language Models to Simulate Human Samples (Political Analysis); Horton (2023) — Large Language Models as Simulated Economic Agents: Homo Silicus (NBER WP 31122); Bisbee et al. (2024) — Synthetic Replacements for Human Survey Data? (Political Analysis); Aher, Arriaga & Kalai (2023) — Using LLMs to Simulate Multiple Humans (ICML).
Bilinen sınırlamalar
VoxSim bir karar destek aracıdır, kehanet makinesi değil. Sınırlamaların açıkça aktarılması sorumlu kullanımın temelidir.
-
Sentetik ajanlar ≠ gerçek insanlar
Yanıtlar, gerçek vatandaşlardan değil istatistiksel ajanlardan gelir. Model bireysel hikayeleri, mikro-topluluk dinamiklerini veya anlık ruh hali değişimlerini yakalayamaz.
-
Kalibrasyon gecikmesi
Model parametreleri en son kalibrasyon döngüsünü yansıtır. Hızla gelişen durumlar — acil krizler, ani liderlik değişimleri — henüz yansıtılmamış olabilir.
-
Korelasyon, nedensellik değil
Yüksek öfke sinyali politikanızın bu öfkeye neden olduğu anlamına gelmez. Eş zamanlı başka faktörler tarihsel örüntüyü açıklıyor olabilir; model atıfı olaya yapar, bağlamsal dış etkenlere değil.
-
Kapsam boşlukları
1999 öncesi olayların anket çıpası yoktur ve kapsam dışıdır. Yalnızca belirli NUTS-2 bölgelerini etkileyen yerel olaylar toplu doğrulukta yetersiz temsil edilebilir.
-
LLM değişkenliği (mitigasyon: Bisbee + Atari)
Simülasyon çıktıları büyük dil modelleri tarafından üretilir ve LLM doğasındaki sınırlamaları taşır: halüsinasyon riski, prompt ifadesine duyarlılık, gerçek dünya anlayışı eksikliği. Faz 1.8'de aktif mitigasyonlar yerleştirildi — Bisbee replication sweep (N=5 σ ölçümü, bkz. 04.6), Atari WEIRD bias için Türkçe few-shot kütüphanesi (12 cluster × 3 aggregate pattern). Tek-shot çıktı hâlâ sınırlıdır; production'da unstable band tespit edilirse PDF'e uyarı gömülür.
-
Sentetik anket kamuoyu yoklaması değildir
Modül K (Pazar Anketi) sentetik nüfus üzerinde LLM tabanlı dağılım tahmini üretir; gerçek seçmenle yapılmış bir anket DEĞİLDİR ve kamuya bu şekilde yayınlanamaz. 2023 hatırlama dağılımı yalnızca kalibrasyon kalitesi göstergesidir — tahmini son seçim sonucuna çekmek için düzeltici olarak KULLANILMAZ. Yaklaşan seçimden önceki son 10 gün Modül K otomatik devre dışıdır (YSK kanunu).
-
Belediye anketinde cluster payları il bazında yerelleştirilmez
Belediye anketi varyantında 12 siyasi cluster'ın ulusal payları il bazında yeniden tahmin edilmez (küçük illerde örneklem seyrekliği riski nedeniyle bilinçli karar). İl bağlamı LLM prompt'una enjekte edilir ve model cluster içi davranışı il bağlamına göre revize eder; atipik illerde (örneğin bir cluster'ın il içindeki gerçek payının ulusal paydan çok saptığı durumlarda) bu yaklaşımın hata payı artar. 2019 + 2024 YSK anchor'larıyla il bazında kalibrasyon ölçülür; 51 il anchor'ı ikincil kaynaklardan derlenmiştir ve düşük güvenli iller config'te UNCERTAIN olarak işaretlidir.
Akademik referanslar: Bisbee et al. (2024) — Synthetic Replacements for Human Survey Data? The Perils of LLMs (Political Analysis); Santurkar et al. (2023) — Whose Opinions Do Language Models Reflect? (ICML); Park et al. (2023) — Generative Agents: Interactive Simulacra of Human Behavior (UIST); Atari et al. (2023) — Which Humans? (WEIRD bias in LLMs).
Uyumluluk ve etik çerçeve
VoxSim, AB ve Türkiye mevzuatı kapsamındaki veri koruma, yapay zeka şeffaflığı ve etik gereksinimleri göz önünde bulundurularak tasarlanmıştır.
-
EU AI Act (Yüksek Risk Sınıflandırması)
Demokratik süreçleri etkileyebilecek yapay zeka sistemleri yüksek risk kapsamındadır. VoxSim bu kapsamda şeffaf doğruluk skoru, insan gözden geçirme aşaması ve kötüye kullanım önleyici etik filtreler ile tasarlanmıştır.
-
GDPR (Genel Veri Koruma Tüzüğü)
Sistem sentetik (yapay) veri kullanır — gerçek bireysel kişisel veri içermez. Müşteri belgeleri DPA çerçevesinde işlenir. Veri saklama 12 ay; silme hakkı self-service olarak sağlanır.
-
KVKK (Kişisel Verilerin Korunması Kanunu)
Türkiye merkezli müşteriler için KVKK uyumlu veri işleme sözleşmesi uygulanır. Talivio Technology OÜ veri işleyici, müşteri ise veri sorumlusu konumundadır.
-
Sentetik veri ve gizlilik
Üretilen simülasyon çıktıları gerçek kişi veya anket katılımcılarının verisine dayandırılmaz. İstatistiksel dağılımlar (<a href="https://data.tuik.gov.tr/Kategori/GetKategori?p=nufus-ve-demografi-109" target="_blank" class="underline hover:text-navy-500">TÜİK</a> ve kamuya açık araştırmalar) toplu seviyede kullanılır.
Uyumluluk ve yasal sorular için: [email protected]
İlk simülasyonunuzu çalıştırmaya hazır mısınız?
Söylem Testi modülüyle başlayın — sonuçlar 5 dakikadan kısa sürede.