Jun
17
2009
هماین چند دقیقه پیش در فیسبوک دیدم که دوستی یک لینک از خبرگزاری انتخاب گذاشته دربارهی یک تحلیل آماری از انتخابات. نویسندهی این تحلیل با استناد به قانون بنفورد نتیجهگیری کرده که احتمال تقلب در انتخابات بالای ۹۹ درصد است. متأسفانه این تحلیل یک مشکل سادهی محاسباتی دارد.
طبق قانون بنفورد، احتمال این که رقم دوم از سمت چپ یک داده در دنیای واقعی ۲ باشد برابر ۰٫۱۰۸۸۲ است. در انتخابات این دورهی ریاست جمهوری وزارت کشور آمار ۳۶۶ شهرستان را اعلام کرد. پس احتمال این که رقم دوم از سمت چپ آرای هر کاندید ۲ باشه برابر ۴۰ هست. متأسفانه نویسندهی این تحلیل آماری، این عدد را به اشتباه ۷۳ حساب کردهاند. هماین عامل باعث شده که توان دوم خی بزرگ باشد و نویسنده خیال کند که تقلبی صورت گرفته.
راستاش من دو روز بود که داشتم روی نتایج انتخابات و مقایسهی آنها با قانون بنفورد کار میکردم. جدا از این که چرا قانون بنفورد برای نتایج انتخابات کار میکند، من چیز مشکوکی در نتایج ندیدم و بعید میدانم بشود از این روش به نتیجهی محکمی دربارهی تقلب رسید.
تکمیلی: خانم مریم لینکی به یک مقاله در arXiv فرستادهاند که توصیه میکنم حتمن نگاه بکنیداش. این مقاله آمده است و به جای استفاده از قانون بنفورد برای رقم دوم از سمت چپ، از فرم سادهی قانون بنفورد برای رقم اول استفاده است. خلاصهی نتیجهی مقاله این است که آرای آقای کروبی مشکوک است. چرا؟ چون فراوانی ۷ به عنوان رقم اول بیش از دو انحراف معیار بیشتر از آنی است که باید باشد. جالب اینجاست که من هم یک بار دربارهی عدد ۷ در این وبلاگ نوشته بودم. هر وقت صحبت از عدد تصادفی میشود، ذهن آدم به سمت ۷ متمایل میشود. آیا این نشان میدهد که یک نفر آرای آقای کروبی را دستی وارد کرده است؟ نمیشود با قطعیت گفت ولی سرنخ خیلی خوبی است.
خانم پانتهآ لینک دیگری فرستادهاند از یک نفر در دانشگاه میشیگان (فرمت PDF). ایشان در مقالهای نتایج انتخابات را تحلیل آماری کرده ولی در نهایت نتیجه گرفته که دادههای موجود برای تشخیص تقلب کافی نیست. بهنظر باید نتایج با تفکیک بیشتری، مثلن در حد حوزه یا صندوق، موجود باشد تا بتوان نتیجهی دقیقتری گرفت.