Örnekler ve evren: Bilmeniz gerekenler

8 Eylül Pazartesi sabahının erken saatlerinde, Buenos Aires eyaletindeki parlamento seçimlerinin sonuçlarını "tam olarak" öğreneceğiz. Ancak kazananların ve kaybedenlerin soyadlarını "hemen şimdi" öğrenmek isteyen endişeli insanlar var. Tahminlerine güvenmeyerek, ifadelerini örneklemlere dayandıran anketörlere danışıyorlar. Belki de cehaletten, büyük olasılıkla müşterilerinin ve gazetecilerin baskısı nedeniyle, herhangi bir örneklemde örtük olarak bulunan kaçınılmaz hatayı yansıtmak için aralıkları yayınlamaları gerekirken, nokta tahminlerini (ve ondalık sayılarla!) yayınlıyorlar. Anketörlerin bulgularını nasıl yorumlamalıyız?
Bu bağlamda, babasının arkadaşları olan Pierre-Simon Laplace ve Joseph-Louis Lagrange tarafından matematiğe kendini adamaya ikna edilen Fransız Augustin Louis Cauchy'ye (1789-1857) danıştım. Paris'teki École Polytechnique ve École des Ponts et des Canals'da eğitim gördü. 1830'da Torino ve Prag'da sürgüne gitti ve burada özel ders öğretmenliği yaptı. Sekiz yıl sonra Paris'e döndü ve ardından Sorbonne'da ders verdi. Eserlerinin tamamı 27 cilt halinde yayımlandı. Bunlar arasında koşul, varsayım, eşitsizlik, yasa, problem, dizi ve Cauchy teoremi yer alıyor.
–Soyadınız bir olasılık dağılımıyla ilişkilendirilmiştir.
–Doğru. Olasılık dağılımı, belirli bir değişkenin her olası değerini karşılık gelen olasılıkla ilişkilendiren bir fonksiyondur. Carl Friedrich Gauss tarafından icat edilen ve çan eğrisi olarak da bilinen normal eğri o kadar popülerdir ki, birçok kişi ürünü bir markayla ilişkilendirir. Bu, reklamverenlerin idealidir: tüketiciler ağrı kesici yerine Geniol veya fotokopi yerine Xerox der. Ayrıca binom, tekdüze, Simeon Denis Poisson ve Laplace olasılık dağılımları da vardır.
–Sizinkini ne karakterize ediyor?
–Normal dağılıma benzer bir şekle sahiptir, ancak daha uzun ve kalın kuyrukları vardır. Öncelikle, Nassim Nicholas Taleb'in Kara Kuğu adlı eserinde resmettiği gibi patolojik durumları göstermek için kullanılır.
–İşimize dönelim. Anket sonuçlarını sabırsızlıkla bekleyip tırnaklarını yiyenlere ne söylemek istersiniz?
–Evren ile örneklem arasında ayrım yapalım. Evren bir bütündür: örneğin, tüm Vélez Sarsfield taraftarları. Örneklem ise evrenin bir parçasıdır: örneğin, bahsi geçen kulübün tüm üyeleri. Çoğul kullanıyorum çünkü aynı evrenin birçok örneği olabilir. Buenos Aires eyaleti örneğinde, evrenin sonucu ancak tüm oylar sayıldığında belli olacaktır.
–Kaygılı kişiler ne yapabilir?
–Tüm seçmenlere sorular sorulan ve anketörlere gerçeği söylemeleri ve anketi cevaplamaları ile oy kullanmaları arasında oy verme niyetlerinin değişmemesi için dua edilen bir anket.
–Bu açıkça çok pahalı.
–İşte tam da bu yüzden örnekler icat edildi; üzerinde çok fazla teori ve deneyim bulunan bir konu. Oylama söz konusu olduğunda, evrene danışmak son derece maliyetlidir. Diğer durumlarda ise tamamen ters etki yaratır. Doktorunuzun kan kalitenizden emin olmak için küçük bir örnek değil, vücudunuzdaki tüm örneği aldığını düşünün. Teşhis, örnekleme hatasından arınmış olurdu ama ölürdünüz.
–Örnekleme hatası mı diyorsunuz?
– Yani anket rastgele ve tabakalı olarak yapılsa bile, örneklemde elde edilen değerin evrendeki ilgili değerle uyuşacağı konusunda kesin bir kesinlik yoktur.
-Ve daha sonra?
–Örneklemlerde elde edilen değerlerin tek sayılar olarak, hatta ondalık sayılar olarak değil, aralıklar halinde yayınlanması gerekir. Örneğin: Anketör, aday X'in oy verme niyetinin %32,8 olduğunu söylememeli, bunun yerine, örneğin %Y örnekleme hatasıyla %30 ile %34 arasında olduğunu söylemelidir.
–Örnekleme hatası nasıl tahmin edilir?
–Örneklem büyüklüğü ve evrende var olduğuna inanılan olasılık dağılımı nedeniyle. Sonuçları bu şekilde sunmak daha az şok edici olabilir, ancak daha uygundur. Bu arada, bir seçimden sonra medya doğru cevabı veren anketörleri tebrik ettiğinde, anketör – bunu kamuoyuna söylemese bile içten içe – bunun önemli bir şans faktörü içerdiğini bilir.
–Örnekleme hatası kaçınılmazdır.
–Evet, önemli olan, örneklem tahmini için gereken hassasiyet ile buna karşılık gelen örnekleme hatası arasındaki çelişkiyi anlamaktır. Doğru bir tahmin talep eden ve hatta ondalık sayılar kullanan (yukarıda bahsedilen %32,8 gibi) herkes, örnekleme hatasının son derece yüksek olacağını bilmelidir. Öte yandan, belirli bir adaya oy verme niyetinin %0 ile %100 arasında olduğunu söyleyen bir anketör kesinlikle yanılmış olmayacaktır, ancak bu sonuç işe yaramaz.
–Seçimlerde sorun daha da kötü, çünkü hangi adayın hangisini yeneceğini bilmek istiyoruz.
–Gerçekten de öyle. Mesleki sorumluluk sahibi bir anketör, aday J'nin oy verme niyetinin %40 ila %44 arasında, aday K'nin ise %39 ila %43 arasında olduğunu söylemek zorundadır; tüm bunlar %X'lik bir örnekleme hatasıyla gerçekleşir. Dolayısıyla, ankete dayanarak, seçim sonucunu makul bir şekilde tahmin etmenin hiçbir yolu yoktur.
–Evrendeki oy verme niyetleri çok farklı olsaydı, örneğin bir aday oyların %85’ini, diğeri ise kalan %15’ini alsaydı, sonuç farklı olurdu.
–Elbette, çünkü bu durumda teknik olarak kusurlu bir anket bile büyük olasılıkla nihai sonucu tahmin edebilirdi. Ancak Buenos Aires eyaletinde, Frente La Libertad Avanza (Özgürlük İlerleme Cephesi) ve Fuerza Patria (Vatan Gücü) adayları arasında durum böyle görünmüyor.
–Biz intihara hazırız.
–Olmaz. Yapmamız gereken, posta kutusu satın almamak için anlamak. Evren tahrif edilemez; evrenin ta kendisi (her ne kadar seçimlerde oy verme niyetleri değiştirilebilse de). Ve oy verme niyetleri evrenin her yerinde birbirine çok benzediğinde, 7 Eylül'den önce herhangi bir şey bilmemiz çok zor.
–Bununla birlikte, seçim gününe kadar bazı radyo ve televizyon kanalları programlarının büyük bölümünü sonuçları tahmin etmeye ve olası sonuçlar hakkında spekülasyon yapmaya ayıracaklardır.
–Evet, sandıklar "konuşana" kadar kendimizi bir şeylerle eğlendirmeliyiz. Ama ne anket teorisine ne de onları profesyonel olarak kullananlara, sağlayamayacakları şeyleri sormayalım. Çünkü zorluk evrende, örneklerde değil.
–Don Augustin, çok teşekkür ederim.

lanacion