Açık metodoloji

VoxSim nasıl çalışır?

VoxSim'in çalışma mantığını, doğrulama yöntemlerini ve sınırlamalarını açık bir dille anlatan metodoloji rehberi.

Siyasi küme Bilgi ekolojisi Pipeline Demografik nüans Kalibrasyon Doğruluk skoru Replikasyon & sadakat Olay kapsamı Pazar sinyali Sınırlamalar

Birincil eksen: 12 siyasi küme + yankı odası

VoxSim simülasyonun birincil ekseninde demografi değil, siyasi eğilim vardır. Türkiye toplumu 12 siyasi kümeye bölünür (sosyal demokrat, dindar muhafazakar, milliyetçi muhafazakar, kürt siyasi, genç kararsız, vb). Her küme kendi yankı odasından beslenir.

Her küme için haber kaynakları dört zaman penceresinde taranır; yapay zeka bu zaman-ağırlıklı haber ortamını okuyarak kümenin şu anki ruh halini, şikayetlerini ve baskın anlatı çerçevelerini çıkarır. Söylem değerlendirmesi bu canlı bağlama karşı yapılır.

Her kümenin gösterilen nüfus payı (%oran), ulusal kamuoyu araştırmaları ve seçim verilerinden elde edilen çapraz tablo tahminlerine dayanır. Türkiye'nin lider bağımsız kamuoyu araştırma kuruluşundan türetilmiş yaşam tarzı tipolojisi (LKA takma adıyla anılır) bu tahminlerin temel çerçevesini oluşturur. Kaynak kuruluşun ticari veri lisansı kapsamında ismi gizli tutulur; ham tablolar yeniden yayınlanmaz, yalnızca istatistiksel çıkarım aktarılır.

siyasi küme

haber kaynağı / küme

zaman penceresi

Not: Kaynak isimleri (gazete, TV, podcast) ürün arayüzünde ve PDF raporlarında AÇIK YAZILMAZ — yalnızca codename (SOURCE_K1, SOURCE_M2, ...). Yayıncıların kendi RSS feed'leri kullanılır (publisher-self-published = implicit license); custom scraping yapılmaz (EU AI Act provenance + ToS uyumu).

Bourdieu 3-Kapital × LKA Alt-tipoloji

Her küme için Bourdieu (Distinction, 1984) 3-kapital teorisi (ekonomik · kültürel · sosyal) ve LKA'nın Ekim 2024 tarihli kamuya açık alt-tipoloji çalışması uygulandı. Tablo; kümelerin toplumdaki konum ve eğilimlerini özetler; bireysel profil değildir. Bu sermaye haritası yapay zekanın Türkiye bağlamına özgü siyasi davranış modellemesini güçlendirir.

Küme	Ekonomik	Kültürel	Sosyal	LKA Alt-tip
ulusalci_sol	3	4	4	Modern Seküler
sosyal_demokrat	4	5	4	Modern
liberal_kentli	5	5	3	Liberal Modern
merkez_sag	3	3	4	Muhafazakar Modern
dindar_muhafazakar	3	3	5	Dindar Muhafazakar
islamci_taban	2	3	5	Dini Muhafazakar
milliyetci_muhafazakar	2	3	4	Geleneksel Muhafazakar
iyi_parti_merkez	4	4	3	Liberal Muhafazakar
kurt_siyasi	2	3	5	Geleneksel-Etnik
genc_kararsiz	2	4	2	Modern Genç
kentli_kararsiz	3	4	2	Modern
anadolu_kararsiz	2	2	4	Geleneksel Muhafazakar

1 = çok düşük, 5 = çok yüksek. Lacivert tonları yüksek sermaye, amber tonları düşük sermaye.

Akademik referanslar: Bourdieu (1984) — Distinction: A Social Critique of the Judgement of Taste (Harvard UP); Çarkoğlu & Kalaycıoğlu (2021) — Fragile but Resilient? Turkish Electoral Dynamics, 2002–2015 (U. Michigan Press); Çarkoğlu & Kalaycıoğlu (2020) — Elections and Public Opinion in Turkey (Routledge); Çarkoğlu & Toprak (2007) — Religion, Society and Politics in a Changing Turkey (TESEV).

12 siyasi kümeyi keşfedin

Her kümenin profil, bilgi ekolojisi, dönen anlatılar ve haftalık snapshot geçmişi.

01.5

Bilgi ekolojisi haritalama (3-tier hibrit kaynak)

Büyük haber ajanslarının doğal kalite filtresi, bir kümeyi gerçekten tanımlayan bazı kritik kaynakları dışarıda bırakır. Niş yayıncılar — özellikle ideolojik odaklı medya organları — küresel kataloglarda yer almaz; ama belirli siyasi kümelerin gerçek ruh halini ve kaygılarını anaakım kaynaklardan çok daha iyi yansıtır.

VoxSim bu boşluğu hibrit kaynak yapısıyla kapatır: yayıncıların kendi RSS akışları üzerinden derlenen çok katmanlı bir haber tabanı oluşturulur (anaakım + niş + yankı odası). Her içerik parçası kaynak kalitesi ve tipi bakımından sınıflandırılır.

Anaakım doğrulanmış

Geniş okuyucu kitlesine sahip büyük haber kuruluşları — editoryal standartı yüksek, içerik doğrulama süreçleri yerleşik.

Niş doğrulanmış

Belirli bir kitleye hitap eden, editoryal standartlarını koruyan niş yayıncılar.

Niş doğrulanmamış

Küçük yayıncılar — doğrulanmamış ama küme için sinyal verebilir.

Yankı odası

Belirli bir siyasi kümenin iç dünyasını yansıtan ideolojik yayıncılar — kümenin gerçek ruh halini okumak için kritik kaynaklar.

Dezenformasyon (küme tüketiyor)

Dezenformasyon örüntüsü taşıyan kaynaklar — VoxSim bu içeriklerin doğruluğunu onaylamaz; yalnızca kümenin neyi tükettiğini sosyolojik bir gözlem olarak ölçer.

Önemli metodoloji notu

VoxSim bilgi ekolojisi haritalaması yapar — kümenin TÜKETTİĞİ gerçeği ölçer, hangi gerçeğin doğru olduğuna karar vermez. Bu Sunstein, Bail ve Levy'nin akademik echo chamber çalışmalarının standart metodolojik çerçevelemesidir.

✓Disinformation tier içeriği VoxSim tarafından doğru olarak yayınlanmaz; "küme bunları tüketiyor" sinyali olarak işlenir.
✓Yapay zekaya açık bir yönerge verilir: görev doğrulama değil, bilgi ekolojisi haritalama.
✓Müşteri raporlarında ekolojik kompozisyon görsel olarak şeffaflıkla gösterilir (mainstream %X, echo chamber %Y, disinformation %Z).

Workspace opt-out: Karargah tier müşterileri saf mainstream-only veri istiyorlarsa Workspace settings'ten niş + dezenformasyon kaynaklarını kapsam dışı bırakabilirler.

Akademik referanslar: Sunstein (2017) — #Republic: Divided Democracy in the Age of Social Media (Princeton UP); Bail (2021) — Breaking the Social Media Prism (Princeton UP); Levy (2021) — Social Media, News Consumption, and Polarization (American Economic Review); Cinelli et al. (2021) — The Echo Chamber Effect on Social Media (PNAS); Bakshy, Messing & Adamic (2015) — Exposure to Ideologically Diverse News on Facebook (Science); Garrett (2009) — Echo Chambers Online? Selective Exposure Among Internet News Users (JCMC).

01.6

Günlük yankı odası pipeline'ı

Her kümenin snapshot'ı her gece dört aşamalı pipeline ile yeniden inşa edilir. Toplam süre ≈ 30 dakika; 02:30–03:30 İstanbul saatleri arasında çalışır. Gün içindeki simülasyonlar her zaman bir önceki geceye ait context okur. Önemli kısıt: gün içinde patlak veren anlık krizler, aynı gece pipeline'ı tamamlanana kadar snapshot'a dahil değildir — Modül B bu durumda Olay Enjeksiyonu (Modül E, Karargah+) ile tamamlanmalıdır.

Gece çalışma akışı (Istanbul saatiyle)

Makale ingest

Yayıncıların kendi RSS feed'leri (mainstream + niche). Kaynak başına son ~2 gün makale.

02:30 TR · gece boyu otomatik çalışır

Makale başına özet

Her makale ≤200 kelimelik yapılandırılmış özete dönüştürülür. Orijinal metin saklanmaz.

02:45 TR · LLM çıkarım aşaması

Vektör embedding

Başlık + özet → yüksek boyutlu semantik vektör. Semantik arama ve küme centroid hesabı için kullanılır.

02:50 TR · semantik indeksleme

Küme snapshot rebuild

Küme başına: zaman-ağırlıklı özet örneklemesi → LLM ruh hali, şikayetler ve lexicon kompoze eder.

03:00 TR · 12 küme · gece snapshot

Aşamalar paralel çakışmayı önleyen kilitle sıralı çalışır. Bir aşama başarısız olursa sonraki yine de dünkü veriyle çalışır — sessiz bozulma yok.

Üstel unutma eğrisi (w = exp(−t/τ))

Her makaleye yaşına göre <strong>w(t) = exp(−t / τ)</strong> ağırlığı verilir; bucket ağırlıkları bu eğrinin pencere sınırları üzerindeki integralinden deterministik olarak türetilir. τ (tau) zaman sabiti tek doğruluk kaynağıdır — yarı-ömür τ·ln(2). Murre & Dros (2015 PLOS ONE) Ebbinghaus replikasyonu ve Wu et al. (2007 PNAS) haber dikkat decay literatürüne dayanır.

Son 2 hafta 26.7%

Son 3 ay 59.8%

Son 6 ay 11.7%

Son 12 ay 1.8%

w(t) = exp(−t / τ) · τ = 45.0 gün · yarı-ömür = 31.2 gün

Bucket ağırlıkları aşağıda canlı hesaplanır — config değiştirildiğinde otomatik güncellenir. LLM'e makale-bazlı ağırlık olarak da iletilir; bucket'lar yalnızca input bütçesi (token kotası) için kullanılır.

Kaynak anonimliği

Tüm public yüzeyler — config dosyaları, API yanıtları, PDF raporlar, audit log'lar, bu sayfa — haber kaynaklarını yalnızca codename ile gösterir (örn. SOURCE_K1, SOURCE_M3). Gerçek kaynak URI mapping'i sadece Talivio compliance ekibinin erişebildiği şifreli bir dosyada bulunur.

Public (kod, log, rapor)

SOURCE_K1, SOURCE_M2, SOURCE_D5, …

Codename'ler taxonomy versiyonları arasında kararlı — müşteri dashboard kurabilir.

Şifreli mapping

[encrypted · ops-only]

Gerçek yayın URI'leri. Rotation politikası + her okumada erişim audit.

Backtest temporal pin

VoxSim tarihsel bir olayı simüle ettiğinde (örn. Şubat 2023 depremi), bugünün küme snapshot'ını kullanmak yanıltıcı olur — 2023'te kümelerin inançları farklıydı. Backtest, event_date tarihinde veya öncesinde aktif olan snapshot versiyonunu seçer.

Snapshot'lar append-only

Eski snapshot'lar asla overwrite edilmez. 2024-09 olayı için bir simülasyon 2024-09-15 snapshot'ını okur, en güncelini değil. Bu Doğruluk Skoru kalibrasyonunu dürüst kılar — bir kümenin geçmiş inançlarını retroaktif olarak "düzeltme" hakkımız yok.

Günlük güncelleme maliyeti

Günlük yankı odası güncellemesi minimum maliyetle çalışır: RSS içerik toplama tamamen ücretsiz; yapay zeka işleme gideri ise simülasyon başına değil, 12 küme için sabit günlük bütçe içinde kalır. Bu mimari, platform sürdürülebilirliğini garanti eder.

Akademik referanslar: Murre & Dros (2015) — Replication and Analysis of Ebbinghaus' Forgetting Curve (PLOS ONE); Tversky & Kahneman (1973) — Availability: A Heuristic for Judging Frequency and Probability (Cognitive Psychology).

İkincil eksen: demografik nüans

Siyasi kümenin yanında ikincil bir eksen daha çalışır: demografik dağılım. Türkiye'nin yetişkin nüfusu üç bağımsız boyutta kesiştirilerek istatistiksel bir model oluşturulur: coğrafya (NUTS-2 bölgeleri), sosyo-ekonomik düzey (SES) ve kültürel-yaşam tarzı kümesi. Bu üç boyutun her kombinasyonu 26 × 4 × 3'lük matrisin bir hücresini oluşturur.

Her hücredeki sentetik ajanlar, kamuya açık demografik anketlerden ve nüfus sayımı verilerinden türetilmiş istatistiksel dağılımlar taşır. Hiçbir gerçek birey temsil edilmez; her ajan prosedürel olarak üretilmiş istatistiksel bir bileşimdir.

NUTS-2 coğrafi bölge

Sosyo-ekonomik düzey (AB · C1 · C2 · DE)

Kültürel-yaşam tarzı kümesi

Üç yaşam tarzı kümesi, Türkiye toplumunun laiklik, gelenek ve dindarlık konusundaki öz-tanımlama örüntülerine ilişkin araştırmaları yansıtır. Yaklaşık ulusal oranlar şöyledir: (Veriler: TÜİK ADNKS ve LKA'nın kamuya açık yaşam tarzı araştırması).

Modern / Laik ~%34

Kentsel odaklı, dijital doğan, laik değer sistemi, yüksek eğitim yoğunluğu

Geleneksel Muhafazakâr ~%42

Anadolu kökleri, aile ve toplum odaklı, ılımlı dindarlık, hızlı değişime mesafeli

Dindar Muhafazakâr ~%24

Yüksek dindarlık, cemaat bağı güçlü, değer odaklı, doğu ve iç bölgelerde yoğun

Not: Tüm segment oranları kamuya açık toplu anket araştırmalarından türetilmiş sentetik yaklaşımlardır. VoxSim bireysel düzeydeki anket yanıtlayıcı verilerini barındırmaz veya işlemez.

Mevcut implementasyon (Faz 1.8+): 312 demografik hücre iki aşamalı üretilir: (1) koşullu istatistiksel örnekleme ile her hücreye stokastik varyasyon eklenir; (2) Yinelemeli Oransal Uyum (Beckman 1996) algoritmasıyla bölge, gelir grubu ve yaşam tarzı dağılımları TÜİK ADNKS 2023 ve LKA Ekim 2024 hedeflerine yakınsatılır. Coğrafi ve kültürel koşullu yapılar (Doğu = daha dindar, kentsel üst gelir = daha modern) korunur.

Akademik referanslar: Beckman, Baggerly & McKay (1996) — Creating Synthetic Baseline Populations (Transportation Research A); Müller & Axhausen (2011) — Hierarchical IPF: A Synthetic Population for Switzerland (ERSA); Park et al. (2023) — Generative Agents: Interactive Simulacra of Human Behavior (UIST); Argyle et al. (2023) — Out of One, Many (Political Analysis); Aher, Arriaga & Kalai (2023) — Using LLMs to Simulate Multiple Humans (ICML).

Tarihsel olay kalibrasyonu

Bir simülasyon motoru yalnızca kalibrasyonu kadar iyidir. VoxSim popülasyon modelini, nesnel bir çıktının — seçim sonucu veya güvenilir anket verisi — gerçek ölçüm sağladığı tarihsel olaylara karşı doğrular. Bu süreç backtest kalibrasyonu olarak adlandırılır.

1

Tarihsel olayları derle

Her olay tarih, kategori, açık bir Türkçe açıklama ve Wikipedia, Resmî Gazete, haber arşivleri gibi kamuya açık kaynaklara yönlendiren URL ile belgelenir.
2

Referans verisini belirle

Yalnızca nitelikli referans ölçümü olan — ulusal seçim sonucu, güvenilir anket veya resmî istatistik — olaylar kalibrasyon setine girer. Bu, ayrıştırıcı ölçüttür.
3

Popülasyon simülasyonu çalıştır

Olay açıklaması simülasyon motoruna iletilir; motor tüm popülasyon hücrelerinde duygusal tepkiyi (öfke, korku, umut, ilgisizlik, destek) tahmin eder.
4

Gerçek ölçümle karşılaştır

Tahmin edilen dağılımlar çıpa ölçümüyle karşılaştırılır. Seçimlerde oy payı değişimleri segment düzeyi destek tahminlerine dönüştürülür; anket sorularında doğrudan duygu soruları doğrulama sağlar.
5

Yinele ve yeniden kalibre et

Sistematik sapmalar model yanlılıklarını ortaya koyar (örn. kırsal dindarlığın eksik ağırlıklandırılması). Parametreler ayarlanır ve kalibrasyon seti ortalama mutlak hata dengelenene kadar yeniden çalıştırılır.

Kalibrasyon için koşul katıdır: bir olay ancak yaklaşık altı ay içinde nitelikli bir ölçüm (seçim veya anket) bulunması durumunda sete dahil edilir. Bu kural, tahmin edilen toplumsal tepkinin bağımsız bir sinyalle karşılaştırılabilmesini sağlar.

Seçim sonuçları

1983'ten bu yana tüm seçimler için YSK sandık ve ulusal oy payı verileri

Anket araştırması

Güvenilir ulusal anket firmalarının yayımlanmış toplu sonuçları

Resmî istatistikler

TÜİK, TCMB ve diğer devlet kurumlarınca yayımlanan toplu veriler

Akademik referanslar: Brier (1950) — Verification of Forecasts (Monthly Weather Review); Tetlock (2005) — Expert Political Judgment (Princeton UP); Hyndman & Koehler (2006) — Forecast accuracy measures; Gneiting & Raftery (2007) — Strictly Proper Scoring Rules (JASA).

Doğruluk skoru hesaplama

Her backtest çalışması olay bazında bir doğruluk tahmini üretir. VoxSim'de raporlanan genel doğruluk skoru, tüm kalibrasyon olaylarının olay güvenilirliğiyle ağırlıklandırılmış ortalamasıdır.

Doğruluk metrikleri (4 skor yan yana raporlanır)

Brier = (1/N) · Σ (p_norm − a_norm)² proper

Log-score = − Σ a_norm · log(p_norm) proper

RMSE = √((1/N) · Σ (p − a)²) proper (ortalama-tahmin)

CRPS = (1/m)·Σ|x_i − y*| − (1/(2m²))·Σ|x_i − x_j| proper

MAE = (1/N) · Σ |p − a| legacy

Accuracy = 1 − MAE / 100 legacy

Brier (1950) ve Log-skor (Gneiting-Raftery 2007), istatistiksel olarak katı tahmin değerlendirme ölçütleridir (proper scoring rules); normalize edilmiş duygu dağılımı üzerinde hesaplanır. RMSE yalnızca ortalama-tahmin (mean-prediction) için proper'dır. CRPS (Gneiting-Raftery 2007), sürekli dağılımlar için ek bir katı ölçüttür. MAE ve Doğruluk (1−MAE/100) geriye uyumluluk için korunmaktadır. LLM tabanlı sentetik bir sistemde Brier skoru model tutarlılığını ölçer; sahadaki frekantist seçmen dağılımının doğrulaması değildir.

Skor konu kategorisine (ekonomik, siyasi, güvenlik vb.) göre ayrıştırılır; kullanıcılar modelin hangi politika alanlarında daha başarılı, hangilerinde daha zayıf olduğunu tam olarak görebilir. Her skor, onu üreten belirli olaylara geri bağlantı verir — kara kutu değil, tam şeffaflık.

≥ 85%

Yüksek güven Tahminler çıpa ölçümlerine yakın; karar desteği için güvenilir

70–84%

Orta güven Bazı hücrelerde belirgin sapma; çıktıyı kesin değil yönsel olarak değerlendir

< 70%

Düşük güven Önemli model yanlılığı tespit edildi; kalibrasyon devam ediyor

Doğruluk skoru modelin sonucu bilinen geçmiş olayları ne kadar iyi tahmin ettiğini yansıtır. Gelecekteki tahmin performansını garanti etmez. Toplumsal dinamikler değişir — model, yeni kalibrasyon verisi sunuldukça güncellenir.

Son doğrulama ölçümü (2026-05-27) EMPİRİK

Güncellenmiş metodoloji (üstel unutma eğrisi + Bourdieu kapital profili + Türkçe örnek davranış kalıpları) ile yapılan 46 olaylık tam A/B testi: ağırlıklı doğruluk %81.84, ortalama mutlak hata 18.16. Önceki metodoloji 50 olaylık testte %62.31 idi. Toplam fark: +19.53 puan. Adil karşılaştırma (aynı 6 olay): %80.94 → %82.60 = +1.66 puan, 6 olayın 4'ünde iyileşme.

%81.84

Faz 1.8 (46 olay)

%62.31

Faz 1.5/1.6 (50 olay)

+1.66 pp

same-events (6)

Akademik referanslar: Willmott & Matsuura (2005) — Advantages of MAE over RMSE (Climate Research); Hyndman & Koehler (2006) — Another look at measures of forecast accuracy (Int'l J. Forecasting); Gneiting & Raftery (2007) — Strictly Proper Scoring Rules (JASA).

04.5

Tarihsel Kalibrasyon — 3 Seçim Çıpası (2015–2023)

VoxSim'in 12 küme modeli, gerçek YSK seçim sonuçlarına karşı bağımsız olarak doğrulanmıştır. Her kümenin tarihsel oy dağılımı nüfus paylarıyla ağırlıklandırılarak ulusal tahmine dönüştürülür; gerçek seçim sonuçlarından sapma matematiksel olarak hesaplanır. Aşağıdaki üç çapa (2015 Kasım, 2018, 2023) bütünleşik sağlık skorunu üretir.

2002 Milletvekili

88/100

2007 Milletvekili

94/100

2011 Milletvekili

94/100

2015 Haziran Milletvekili

98/100

2015 Kasım Milletvekili

100/100

2018 Milletvekili

99/100

2023 Milletvekili

98/100

2024 Yerel Seçim

98/100

KOMPOZİT SKOR 96/100 (Yüksek güven)

3 seçim ortalamasıdır. Yüksek skor (≥85), küme modelinin tek seçime over-fit olma riskinin düşük olduğuna ve siyasi dönemler arasında robust kaldığına işaret eder.

Tahmin kalitesi kırılımı

proper

0.0002

Brier

1.698

Log-score

0.009

RMSE

Brier (1950) + Log-score (Gneiting-Raftery 2007) strictly proper. RMSE point-prediction proper. calibration_score TVD-tabanlı (gevşek-proper).

Skorlar her gün otomatik olarak yeniden hesaplanır; model parametreleri güncellendiğinde anlık olarak yansıtılır. Bu hesaplamalar yapay zeka çağrısı gerektirmez — tamamen deterministik matematiksel işlemlerdir.

Türkiye siyasi kırılma noktaları (2015 — günümüz)

Kalibrasyon ankorlarının arkasındaki olay zinciri: seçimler, yargı kararları, ekonomik şoklar — kaynaklı kronoloji.

04.6

Replikasyon varyansı & algoritmik sadakat

Referans alınan iki temel akademik uyarıya karşı sisteme koruma katmanları eklendi. Aşağıdaki her iki test de canlı veri üzerinden çalışır.

Prompt kararsızlığı — Bisbee (2024) replikasyon taraması

Bisbee ve ark. (2024), Political Analysis dergiside şu uyarıyı yapar: yapay zeka tabanlı sentetik anketler aynı soruyu farklı söyleyişle test edildiğinde tutarsız sonuçlar üretir; tek bir çıktıya güvenmek yanıltıcıdır. VoxSim her şablon için 5 kez tekrar ölçümü yapar, varyans katsayısını hesaplar ve üç kararlılık bandına ayırır: kararlı / orta / kararsız.

Şablon	Bağlam	N	CV	Stabilite
synthetic_poll	kurt_siyasi	2	0.0280	stable
synthetic_poll	islamci_taban	2	0.0707	moderate
synthetic_poll	genc_kararsiz	4	0.0519	moderate

Monte Carlo belirsizlik bandı ve LLM stokastisitesi

Rapor PDF'lerindeki ± değerleri tek bir koşunun iç güven ölçüsü değildir; aynı simülasyonun N bağımsız Monte Carlo koşusunun standart sapmasından türetilir. Büyük dil modelleri deterministik değildir: örnekleme sıcaklığı ve bağlam etkileri nedeniyle aynı girdi her koşuda bir miktar farklı çıktı üretir. VoxSim bu doğal stokastisiteyi bastırmak yerine ölçer ve raporlara belirsizlik bandı olarak yansıtır.

Dar bir bant kesinlik garantisi değildir — yalnızca modelin kendi içinde tutarlı olduğunu gösterir; sistematik yanlılık (bias) bant genişliğine yansımaz. Geniş bant ise söylemin ilgili küme için "hassas bölgede" olduğuna işaret eder. Bu nedenle bant, gerçek dünya hata payı gibi değil, model tutarlılığı göstergesi olarak okunmalıdır.

Algoritmik sadakat — Argyle (2023)

Argyle ve ark. (2023) merkezi önerisi: sentetik popülasyon modelinin demografik altgrupları gerçek alan araştırması bulgularıyla tutarlı biçimde temsil etmesi zorunludur. VoxSim'de 12 küme tahmini, 3 yaşam tarzı segmentine (modern / geleneksel / dindar) toplanarak LKA'nın aylık kamuoyu araştırmasının yayımlanmış çapraz tablolarıyla karşılaştırılır. Sadakat skoru 1.0 = mükemmel örtüşme, 0.0 = tam ayrışma anlamına gelir.

2023

0.767

HIGH · 3 seg

2018

0.761

HIGH · 3 seg

2024_local

0.809

HIGH · 3 seg

Segment bazında ayrıntılı tablo

2023

modern

0.842

gelenekci

0.690

dindar

0.770

2018

modern

0.807

gelenekci

0.654

dindar

0.823

2024_local

modern

0.927

gelenekci

0.677

dindar

0.821

Kültürel önyargı azaltımı — Atari (2023)

Atari ve ark. (2023) bulgusu: büyük dil modelleri, Batı/kentsel/yüksek gelirli toplumlar dışındaki kültürlerde (kolektivist yapılar dahil) sistematik önyargı gösteriyor. Türkiye bu risk grubuna girer. Azaltım yöntemi: 12 küme için 36 Türkçe örnek davranış kalıbı (yalnızca YSK + LKA agregat verisi; bireysel profil değil) yapay zekaya örnekler olarak gösterilir. Bu sayede modelin siyasi yorum ve oy gerekçelendirmesi Türkiye bağlamına kalibre olur.

Cluster

Örnek

Not

Sentetik anket ve söylem testi sorgularına otomatik olarak eklenir. Yapay zekanın Türkiye bağlamına özgü yorumunu güçlendirir; PDF çıktısına yansımaz.

Akademik referanslar: Bisbee et al. (2024) — Synthetic Replacements for Human Survey Data? The Perils of LLMs (Political Analysis); Argyle et al. (2023) — Out of One, Many: Using LLMs to Simulate Human Samples (Political Analysis).

Tarihsel olay kapsamı

Mevcut kalibrasyon seti, 1999'dan 2025'e uzanan 150+ elle seçilmiş olay içerir. Segment düzeyi gerçek ölçüm verisinin daha zengin olduğu 2013 sonrası dönem kasıtlı olarak daha yoğun kapsamlıdır.

38 Seçim sonucu

24 Ekonomik olay

21 Sosyal ve eğitim

18 Dış politika

28 Kriz ve afet

21 Siyasi olay

26 yıllık tarihsel kapsam (1999-2025)

Modül D (Backtest) ve Modül K (Sentetik Anket) kalibrasyonu, 1999'dan bugüne uzanan 26 yıllık politik döngüye dayanır. Şubat 2001 krizi, 2002 AKP doğuşu, 2007 e-muhtıra, 2010 anayasa referandumu, 2013 Gezi olayları, 2016 darbe girişimi, 2018 lira krizi, 2020 COVID, 2023 Kahramanmaraş depremi, 2025 İmamoğlu süreci dahil 67 büyük olay için 12 küme × 5 duygu (öfke, korku, apati, umut, destek) gerçek tepki dağılımı kayıtlı.

1999

Başlangıç

26 yıl

Kapsam

Seçim çıpası

2014 öncesi dönem, günümüz küme yapısıyla geriye yansıtılmıştır — bu olaylar "eski dönem" olarak etiketlenir. 2014 sonrası küme davranışı doğrudan ölçülmüştür. Güncel kalibrasyon bütünleşik skoru bu sayfadaki canlı panelde yayımlanır.

Önceki dönem olayları (2010 öncesi), anket arşivleri seyrek olduğundan birincil çıpa olarak seçim verilerini kullanır. 2013 sonrası olaylar, daha ayrıntılı segment bazlı gerçek ölçüm üretebilen daha zengin anket araştırmalarından yararlanır.

Referans Veri Kuralı

Kalibrasyon setindeki her olayın, olay tarihinden itibaren yaklaşık altı ay içinde nitelikli bir referans ölçümü vardır: seçim sonucu, ulusal anket veya resmî istatistik yayımı. Doğrulayıcı referansı olmayan olaylar, tarihsel önemi ne kadar büyük olursa olsun kapsam dışı bırakılır. Bu kural doğruluk skorunu şeffaf ve güvenilir tutar.

Kalibrasyon seti sürekli genişletilmektedir. Her sürümde eklenen yeni olaylar değişiklik günlüğünde belirtilir. Hedef, ikinci yılın sonuna kadar 500'ü aşkın olaydir.

Akademik referanslar: King & Lowe (2003) — Automated Information Extraction for Conflict Data (International Organization); Schrodt (2012) — Precedents, Progress & Prospects in Political Event Data (Int'l Interactions); Boschee et al. (2015) — ICEWS Coded Event Data (Harvard Dataverse); Leetaru & Schrodt (2013) — GDELT: Global Data on Events, Location and Tone.

05.5

Pazar Sinyal Profili

Karargah · Karargah+

Modül K, 26 NUTS-2 bölge × 4 SES × 3 yaşam tarzı = 312 demografik hücre için bağımsız LLM dağılım tahmini üretir ve bunları nüfus paylarıyla birleştirerek ulusal parti pay tahmini döndürür. Her hücre kendi coğrafi/sosyo-ekonomik/kültürel profili ile sorulur. "Şu an seçim olsa ne olur?" sorusuna sentetik nüfus simülasyonu bazlı bir karar destek sinyali sunar; kamuoyu yoklaması değil, stratejik iç değerlendirme aracıdır.

1

Küme bazlı paralel analiz

Her demografik dilim — coğrafya, sosyo-ekonomik düzey ve yaşam tarzına göre tanımlanan segmentler — ayrı bir analiz oturumunda değerlendirilir. Yapay zeka her segmentin bölgesel siyasi profilini, geçmiş seçim eğilimlerini ve kültürel bağlamını göz önünde bulundurarak tahmin üretir.
2

Hatırlama kalibrasyonu

Her hücreden 2023, 2018 ve 2015 Kasım Milletvekili hatırlama dağılımları da istenir. Ağırlıklı ulusal aggregate YSK resmî sonuçlarıyla karşılaştırılarak composite kalibrasyon skoru üretilir. Hatırlama bir düzeltici değil, model kalitesinin göstergesidir — geçmiş sonuca doğru çekim yapmaz.
3

Nüfus ağırlıklı ulusal birleştirme

Tüm segment çıktıları nüfus paylarıyla ağırlıklandırılarak ulusal tabloya dönüştürülür. Segment içi göreceli sıralama korunurken ulusal toplam, son 30 günde yayımlanmış en az 6 bağımsız anket firmasının trimmed-mean (uçları atılmış ortalama) konsensüsüne Yinelemeli Oransal Uyum (IPF/raking) ile hizalanır. Tarihsel seçim sonuçları yalnızca kalibrasyon kalitesinin göstergesi (recall) olarak kullanılır; tahmini geçmiş sonuçlara çekmez. Geçersiz veya eksik dönen segmentler otomatik olarak kapsam dışı tutulur.

seçim çıpası

25+

yıllık tarihsel kapsam

Kamuoyu yoklaması değildir

Modül K çıktısı kamuya anket olarak yayınlanamaz; karar destek sinyalidir. YSK kanunu uyarınca yaklaşan seçime 10 günden az süre kaldığında otomatik devre dışı kalır. Sentetik nitelik, kullanıcı tarafından her çalıştırmada onaylanır.

05.5b — Cumhurbaşkanlığı varyantı

Karargah · Karargah+

CB seçimi 2-tur sentetik sinyali

Cumhurbaşkanlığı varyantı, aday-bazlı 2-tur dağılım için çalışır. 12 siyasi küme, 5 sabit aday rolü (iktidardaki aday, ana muhalefet, Kürt siyasi cephe, milliyetçi alternatif, dindar sağ) bağlamında analiz edilir. Müşteri ekipleri aday görüntü adlarını kendi seçimlerine göre özelleştirebilir.

• R1'de %50 geçilmediyse otomatik R2 hesabı (R2 her zaman hipotetik olarak doldurulur; aggregator karar verir).
• Kalibrasyon: 2018 R1, 2023 R1 ve 2023 R2 YSK resmî seçim sonuçları. Güncel kalibrasyon skoru bu sayfadaki canlı panelde yayımlanır.
• 2028 aday belirsizliği gözetilerek model esnekliği korunur; müşteri ekipleri tanınan aday isimlerini sisteme girebilir.

⚠ MV anketinin tüm etik bekçi'si CB varyantında aynen geçerli: kamu CB anketi DEĞİLDİR, filigran zorunlu, T-10 yasak penceresi, PDF 30 gün expiry, recall sadece kalibrasyon.

05.5c — Yerel (Belediye) varyantı

Karargah · Karargah+

Belediye başkanlığı il bazlı sentetik sinyali

Belediye başkanlığı varyantı, il bazında (NUTS-3, 81 il) yerel seçim analizi sunar. 12 ulusal siyasi küme, 6 sabit aday rolüyle (mevcut başkan, ana muhalefet, Kürt siyasi, milliyetçi alternatif, dindar sağ, bağımsız-yerel) kesiştirilir. Kümelerin ulusal ağırlıkları korunur; yapay zeka her kümenin il bağlamına özgü davranışını tahmin eder.

• İl seçimi (plaka 01..81) zorunlu. Her prompt'a il adı, bölge, tier (büyükşehir/il) ve (varsa) anchor verisi enjekte edilir.
• TEK TUR — yerel seçimlerde R2 yok. En yüksek geçerli oy alan aday kazanır. Marj (1.−2.) ayrıca raporlanır.
• Kalibrasyon: 2019 + 2024 YSK yerel sonuçları (30 il YSK doğrudan, 51 il TR Wikipedia/YSK alıntısı). Tüm 81 il için kalibrasyon skoru üretilir; düşük güvenli iller config'te UNCERTAIN olarak işaretlidir.
• İl bazlı küme payları sabit kalır; çıktı '12 küme perspektifinden il X fotoğrafı' olarak yorumlanmalıdır. Bu, yetersiz yerel veri sorununu aşmak için bilinçli bir tasarım tercihidir.

⚠ MV anketinin tüm etik bekçi'si yerel varyantta aynen geçerli: kamu yerel anketi DEĞİLDİR, filigran zorunlu, T-10 yasak penceresi, PDF 30 gün expiry, recall sadece kalibrasyon.

Akademik referanslar: Argyle et al. (2023) — Out of One, Many: Using Language Models to Simulate Human Samples (Political Analysis); Horton (2023) — Large Language Models as Simulated Economic Agents: Homo Silicus (NBER WP 31122); Bisbee et al. (2024) — Synthetic Replacements for Human Survey Data? (Political Analysis); Aher, Arriaga & Kalai (2023) — Using LLMs to Simulate Multiple Humans (ICML).

Bilinen sınırlamalar

VoxSim bir karar destek aracıdır, kehanet makinesi değil. Sınırlamaların açıkça aktarılması sorumlu kullanımın temelidir.

Sentetik ajanlar ≠ gerçek insanlar

Yanıtlar, gerçek vatandaşlardan değil istatistiksel ajanlardan gelir. Model bireysel hikayeleri, mikro-topluluk dinamiklerini veya anlık ruh hali değişimlerini yakalayamaz.
Kalibrasyon gecikmesi

Model parametreleri en son kalibrasyon döngüsünü yansıtır. Hızla gelişen durumlar — acil krizler, ani liderlik değişimleri — henüz yansıtılmamış olabilir.
Korelasyon, nedensellik değil

Yüksek öfke sinyali politikanızın bu öfkeye neden olduğu anlamına gelmez. Eş zamanlı başka faktörler tarihsel örüntüyü açıklıyor olabilir; model atıfı olaya yapar, bağlamsal dış etkenlere değil.
Kapsam boşlukları

1999 öncesi olayların anket çıpası yoktur ve kapsam dışıdır. Yalnızca belirli NUTS-2 bölgelerini etkileyen yerel olaylar toplu doğrulukta yetersiz temsil edilebilir.
LLM değişkenliği (mitigasyon: Bisbee + Atari)

Simülasyon çıktıları büyük dil modelleri tarafından üretilir ve LLM doğasındaki sınırlamaları taşır: halüsinasyon riski, prompt ifadesine duyarlılık, gerçek dünya anlayışı eksikliği. Faz 1.8'de aktif mitigasyonlar yerleştirildi — Bisbee replication sweep (N=5 σ ölçümü, bkz. 04.6), Atari WEIRD bias için Türkçe few-shot kütüphanesi (12 cluster × 3 aggregate pattern). Tek-shot çıktı hâlâ sınırlıdır; production'da unstable band tespit edilirse PDF'e uyarı gömülür.
Sentetik anket kamuoyu yoklaması değildir

Modül K (Pazar Anketi) sentetik nüfus üzerinde LLM tabanlı dağılım tahmini üretir; gerçek seçmenle yapılmış bir anket DEĞİLDİR ve kamuya bu şekilde yayınlanamaz. 2023 hatırlama dağılımı yalnızca kalibrasyon kalitesi göstergesidir — tahmini son seçim sonucuna çekmek için düzeltici olarak KULLANILMAZ. Yaklaşan seçimden önceki son 10 gün Modül K otomatik devre dışıdır (YSK kanunu).
Belediye anketinde cluster payları il bazında yerelleştirilmez

Belediye anketi varyantında 12 siyasi cluster'ın ulusal payları il bazında yeniden tahmin edilmez (küçük illerde örneklem seyrekliği riski nedeniyle bilinçli karar). İl bağlamı LLM prompt'una enjekte edilir ve model cluster içi davranışı il bağlamına göre revize eder; atipik illerde (örneğin bir cluster'ın il içindeki gerçek payının ulusal paydan çok saptığı durumlarda) bu yaklaşımın hata payı artar. 2019 + 2024 YSK anchor'larıyla il bazında kalibrasyon ölçülür; 51 il anchor'ı ikincil kaynaklardan derlenmiştir ve düşük güvenli iller config'te UNCERTAIN olarak işaretlidir.

Akademik referanslar: Bisbee et al. (2024) — Synthetic Replacements for Human Survey Data? The Perils of LLMs (Political Analysis); Santurkar et al. (2023) — Whose Opinions Do Language Models Reflect? (ICML); Park et al. (2023) — Generative Agents: Interactive Simulacra of Human Behavior (UIST); Atari et al. (2023) — Which Humans? (WEIRD bias in LLMs).

Uyumluluk ve etik çerçeve

VoxSim, AB ve Türkiye mevzuatı kapsamındaki veri koruma, yapay zeka şeffaflığı ve etik gereksinimleri göz önünde bulundurularak tasarlanmıştır.

EU AI Act (Yüksek Risk Sınıflandırması)

Demokratik süreçleri etkileyebilecek yapay zeka sistemleri yüksek risk kapsamındadır. VoxSim bu kapsamda şeffaf doğruluk skoru, insan gözden geçirme aşaması ve kötüye kullanım önleyici etik filtreler ile tasarlanmıştır.
GDPR (Genel Veri Koruma Tüzüğü)

Sistem sentetik (yapay) veri kullanır — gerçek bireysel kişisel veri içermez. Müşteri belgeleri DPA çerçevesinde işlenir. Veri saklama 12 ay; silme hakkı self-service olarak sağlanır.
KVKK (Kişisel Verilerin Korunması Kanunu)

Türkiye merkezli müşteriler için KVKK uyumlu veri işleme sözleşmesi uygulanır. Talivio Technology OÜ veri işleyici, müşteri ise veri sorumlusu konumundadır.
Sentetik veri ve gizlilik

Üretilen simülasyon çıktıları gerçek kişi veya anket katılımcılarının verisine dayandırılmaz. İstatistiksel dağılımlar (<a href="https://data.tuik.gov.tr/Kategori/GetKategori?p=nufus-ve-demografi-109" target="_blank" class="underline hover:text-navy-500">TÜİK</a> ve kamuya açık araştırmalar) toplu seviyede kullanılır.

Uyumluluk ve yasal sorular için: [email protected]

İlk simülasyonunuzu çalıştırmaya hazır mısınız?

Söylem Testi modülüyle başlayın — sonuçlar 5 dakikadan kısa sürede.

Başvuru Yap → Fiyatlandırma