هم‌این چند دقیقه پیش در فیس‌بوک دیدم که دوستی یک لینک از خبرگزاری انتخاب گذاشته درباره‌ی یک تحلیل آماری از انتخابات. نویسنده‌ی این تحلیل با استناد به قانون بنفورد نتیجه‌گیری کرده که احتمال تقلب در انتخابات بالای ۹۹ درصد است. متأسفانه این تحلیل یک مشکل ساده‌ی محاسباتی دارد.

طبق قانون بنفورد، احتمال این که رقم دوم از سمت چپ یک داده‌ در دنیای واقعی ۲ باشد برابر ۰٫۱۰۸۸۲ است. در انتخابات این دوره‌ی ریاست جمهوری وزارت کشور آمار ۳۶۶ شهرستان را اعلام کرد. پس احتمال این که رقم دوم از سمت چپ آرای هر کاندید ۲ باشه برابر ۴۰ هست. متأسفانه نویسنده‌ی این تحلیل آماری، این عدد را به اشتباه ۷۳ حساب کرده‌اند. هم‌این عامل باعث شده که توان دوم خی بزرگ باشد و نویسنده خیال کند که تقلبی صورت گرفته.

راست‌اش من دو روز بود که داشتم روی نتایج انتخابات و مقایسه‌ی آن‌ها با قانون بنفورد کار می‌کردم. جدا از این که چرا قانون بنفورد برای نتایج انتخابات کار می‌کند، من چیز مشکوکی در نتایج ندیدم و بعید می‌دانم بشود از این روش به نتیجه‌ی محکمی درباره‌ی تقلب رسید.

تکمیلی: خانم مریم لینکی به یک مقاله در arXiv فرستاده‌اند که توصیه می‌کنم حتمن نگاه بکنید‌اش. این مقاله آمده است و به جای استفاده از قانون بنفورد برای رقم دوم از سمت چپ، از فرم ساده‌ی قانون بنفورد برای رقم اول استفاده است. خلاصه‌ی نتیجه‌ی مقاله این است که آرای آقای کروبی مشکوک است. چرا؟ چون فراوانی ۷ به عنوان رقم اول بیش از دو انحراف معیار بیش‌تر از آنی است که باید باشد. جالب این‌جاست که من هم یک بار درباره‌ی عدد ۷ در این وبلاگ نوشته بودم. هر وقت صحبت از عدد تصادفی می‌شود، ذهن آدم به سمت ۷ متمایل می‌شود. آیا این نشان می‌دهد که یک نفر آرای آقای کروبی را دستی وارد کرده است؟ نمی‌شود با قطعیت گفت ولی سرنخ خیلی خوبی است.

خانم پانته‌آ لینک دیگری فرستاده‌اند از یک نفر در دانش‌گاه میشیگان (فرمت PDF). ایشان در مقاله‌ای نتایج انتخابات را تحلیل آماری کرده ولی در نهایت نتیجه گرفته که داده‌های موجود برای تشخیص تقلب کافی نیست. به‌نظر باید نتایج با تفکیک بیش‌تری، مثلن در حد حوزه یا صندوق، موجود باشد تا بتوان نتیجه‌ی دقیق‌تری گرفت.


نظرها

تعداد نظرها: 24

  1. Internet Explorer Windows پرگلک در روز June 17, 2009 و ساعت 4:13 pm گفته:

    بچه ها لطفا این پست رو توی فیس بوک شر کنید

  2. Internet Explorer Windows صورتک خیالی در روز June 17, 2009 و ساعت 4:14 pm گفته:

    اخه چرا هی میخاهید این نتایج رو علمی و موجه جلوه بدید:(

  3. Mozilla Firefox SuSE Linux نامی در روز June 17, 2009 و ساعت 4:17 pm گفته:

    به صورتک خیالی: منظورتون من هستم؟ باور کنید من نمی‌خوام چیزی رو علمی جلوه بدم. فقط دیدم این تحلیل غلط می‌تونه منجر به ضررهای بعدی بشه.

  4. Mozilla Firefox Linux ar در روز June 17, 2009 و ساعت 4:46 pm گفته:

    البته شاید دیده باشین
    http://www.fivethirtyeight.com/2009/06/iran-does-have-some-fishy-numbers.html
    یکی دو تا مطلب دیگه هم داره در مورد انتخابات ایران. گفتم پرتاب کنم این‌جا شما هم نظر بدین D:

  5. Internet Explorer Windows پانته آ در روز June 17, 2009 و ساعت 4:53 pm گفته:
  6. Mozilla Firefox Linux ar در روز June 17, 2009 و ساعت 5:34 pm گفته:

    این رو هم یکی از بچه‌ها لینک داد
    http://www-personal.umich.edu/%7Ewmebane/note17jun2009.pdf
    از این‌جا:
    http://www-personal.umich.edu/~wmebane/
    با عنوان
    Note on the presidential election in Iran, June 2009

  7. Safari Mac OS مریم اینا در روز June 17, 2009 و ساعت 5:56 pm گفته:

    نامی جان، لینک به انتخاب رو نمی تونم باز کنم- همین مقاله است؟
    http://arxiv.org/abs/0906.2789

  8. Internet Explorer Windows علیرضا در روز June 17, 2009 و ساعت 9:33 pm گفته:

    حرف شما درمورد اشتباه محاسباتی سایت انتخاب کاملا درست است.به همین دلیل من همین آزمایش را برای 100 شهربه صورت رندوم واین بار با اطلاعات درست تکرارکردم( منبع آرای هر کاندید از سایت وزارت کشور) نتایج به دست آمده:
    احتمال دستکاری آرا:احمدی نژاد %96.86
    رضایی 96.62
    کروبی 97.43
    موسوی 98.22

  9. Mozilla Firefox Windows amir در روز June 17, 2009 و ساعت 9:44 pm گفته:

    آقای علیرضا خوب چرا برای همه شهرها انجام نمیدید؟

  10. Debian IceWeasel Debian GNU/Linux نامی در روز June 17, 2009 و ساعت 10:30 pm گفته:

    به ar: بله این رو دیده بودم. ولی بازهم ممنون که این‌جا گذاشتید.

    به پانته‌آ: ممنون. گزارش خیلی خوبی است.

    به مریم: نه همون نیست. مقاله‌ی آرکایو رو نگاه کردم. استدلال این مقاله جالب‌تر از کار سایت انتخاب هست.

    به علیرضا: جدی به این نتایج رسیدید؟ اگر نتایج رو به صورت جدول یک جایی بنویسید خیلی خوب میشه. من هم می‌تونم به‌اش لینک بدم.

  11. Mozilla Firefox Windows پی‌کولو در روز June 17, 2009 و ساعت 11:45 pm گفته:

    اشکالی که به محاسبه وارد کردید درسته. اما اصل فرمولی که آقای رستگاری بکار برده ربطی به مرحوم بنفورد نداره. احتمال وقوع رقم ضرب در تعداد شهر‌ها؟؟
    http://www.entekhabnews.us/portal/index.php?news=6435

  12. Debian IceWeasel Debian GNU/Linux نامی در روز June 18, 2009 و ساعت 12:04 am گفته:

    به پی‌کولو: منظورتون از اصل فرمول کدام فرمول هست؟ من به نظرم رسید که ایشان از فرض صفر به هم‌راه قانون بنفورد استفاده کرده‌اند.

  13. Mozilla Firefox Windows h4med در روز June 18, 2009 و ساعت 6:08 am گفته:

    مقاله ای منتشر شده از اقایی به نام
    Boudewijn F. Roukema
    تحت عنوان
    BENFORD’S LAW ANOMALIES IN THE 2009 IRANIAN
    PRESIDENTIAL ELECTION
    احتمالا تا الان دیدینش. نظرتون در موردش چیه؟ قابل استناد برای اثبات وجود تقلب هست؟

  14. Mozilla Firefox Windows eslahtalab در روز June 18, 2009 و ساعت 2:43 pm گفته:

    ham nevisande maghale roznameh entekhab ham shoma yek pish farz asli darid va an in ast ke argham elam shode nashi az shomaresh ara mibashand dar sorati ke aslan momken ast ke amar asli dar zir zamin vezarat keshvar bashand va serfan “adad sazi” sorat gerefte bashad

  15. WordPress 300 هزار رای من کو؟ | Pat.Riot | MohammadAli's Persian Weblog در روز June 19, 2009 و ساعت 8:41 am گفته:

    [...] صرفا بررسی عدد‌ها با ملاک‌های آزمون بنفورد می‌تواند موید تقلب در انتخبات [...]

  16. PHP سید در روز June 19, 2009 و ساعت 9:12 pm گفته:

    برادر تنها اشتباه نویسنده ی اون مقاله، عدد 70 نبوده.
    احتمال 5% برای درست بودن نتایج، برای chi-square بالای 16.92 هست نه 1.69 که توی مقاله استفاده شده.
    در ضمن، تقریباً همه ی فراوانی های ارقام توی اون مقاله اشتباه هستند. مثلاً فراوانی 3 در رقم دوم اعداد برای تمام کاندیداها اشتباهه. توی اکسل می تونین این اعداد رو محاسبه کنین.
    اگر این ها رو در نظر بگیرین، اعداد به دست اومده این طور می شن:
    به ترتیب برای:
    احمدی نژاد - رضایی - کروبی - موسوی
    6.12015086 - 20.26427986 - 6.651039449 - 14.13678614

    و احتمال تقلب (فقط طبق روش های آماری، که به تنهایی دلیل نیست):
    27.21% - 98.36% - 32.65% - 88.24%

  17. Mozilla Firefox SuSE Linux نامی در روز June 19, 2009 و ساعت 9:32 pm گفته:

    به حامد: خانم مریم این را معرفی کرده بودند و من یک توضیح تکمیلی در موردش نوشتم. سواد آمار من خیلی بالا نیست ولی به نظرم مقاله‌ی جالبی آمد.

    به سید: ممنون که اشتباهات دیگر را هم گوش‌زد کردید. به نظرم نویسنده‌ی مقاله‌ی انتخاب کمی با عجله نتایج رو منتشر کرده است.

  18. Internet Explorer Windows سهیل در روز June 20, 2009 و ساعت 9:57 am گفته:

    نکته مهم اینجاست که آقایان بسیار هوشمندانه عمل کرده اند و آمار را به نفع خود تغییر داده اند. چرا؟
    چون استفاده از قانون بنفرد برای داده هایی برقرار است که توزیع نرمال نداشته باشد. درصورتی که داده های شهری به این علت که مجموع داده های بیش از 30 صندوق است دارای توزیع نرمال است و قانون بنفرد در مورد آن صدق نمی کند و باید این محاسبات به حساب زیرکانه آقایان روی صندوقهاصورت پذیرد و نه روی داده های شهری.! تنهایک مقدار دقت لازم دارد تا آمارهای مجعول آقایان دروغگو که شعارشان “دروغ ممنوع” است مشخص شود.

  19. Mozilla Firefox Windows صادق در روز June 20, 2009 و ساعت 11:01 am گفته:
  20. Mozilla Firefox Windows Ãmir در روز June 23, 2009 و ساعت 7:53 am گفته:

    بعد از اونهمه آماری که دکتر تو تلویزیون داد، من کلاً نسبت به درستی بحث های آمار و احتمال به شک افتادم شدید!

  21. Internet Explorer Windows شایار در روز June 24, 2009 و ساعت 11:20 pm گفته:

    دوستان عزیز رای مردم همین 4 تا جون که تو اینترنت و خیابان تهران هستند نیست … اکثرا” به احمدی نژاد رای دادن
    مردم اکثرا گشنه هستن و از دزدیهای هاشمی و خاتمی خسته .

    این قماش فقط بلدن حرف خوب بزنن
    مثل موسوی که حتی یه برنامه درست تا روز آخر نداده بود

    واقعا برای مردم کوته فکرمون متاسفم .

    ضمنا” فکر میکنین انقلاب شدن به آسانی انقلاب 57 که 99 درصد با خمینی بودن ؟
    این شلوغیها نتیجش جنگ داخلی سپس هجوم بیگانه ها و در آخر خوردن گوشت همدیگس …. اونایی هم که خارج از کشور دارن الکی شعار میدن مسئول این بدبختی و کشتار خواهند بود …

  22. Internet Explorer Windows Anonymous در روز June 28, 2009 و ساعت 8:59 am گفته:

    اگه تقلب نشده بود نيازی به قطع کردن پيام کوتاه نبود. با پشتوانه 24 ميليونی که نيازی به اين کارها نيست.
    اون چيزی که من می فهمم اينه که حاکميت يه چيزی رو پنهان کرده که از اطلاع رسانی مردمی می ترسه.

  23. Internet Explorer Windows مجتبی در روز June 28, 2009 و ساعت 9:09 am گفته:

    شايار! دوتا نکته:
    1- منظورت اينه که از ترس لولوی بيرون ده بايد هرکاری که کدخدا کرد هيچی نگيم!
    2- سالم ترين دوران اقتصادی رو در دوران خاتمی داشتيم. اگه خاتمی کوچکترين فساد مالی داشت قطعاً محمود اون رو مطرح می کرد. مراقب باش که تهمت گناه کوچکی نيست.

  24. Internet Explorer Windows شایار در روز June 29, 2009 و ساعت 10:32 pm گفته:

    مجتبی مطمئنی این موضوع رو ؟
    چند نمونه از قرار دادهای گازی رو میخوای برات نام ببرم که به قول خودشون قرار داد ترکمنچای بوده در این زمان آقای خاتمی ؟ !
    مطمئن باش اگه دم این بابا گیر نبود الان مثل موش تو سوراخ نبود
    من طرفدار هیچ گروه و فرقه ایی نیستم . طرفدار منطق و میهنم …
    خائن ترین آدم به نظر من همین خاتمی بود که از رای مردم سوءاستفاده کرد و خیانت کرد به اعتماد مردم نه این احمدی نژاد که همه بهش بد و بیراه میگن ولی بازم کار مثبت به اندازه کل هشت سال اساتید انجام داد …
    بهتره عوض تبلیغات منفی که میبینیم یکم چشمونو باز کنیم و بازیچه قدرت آقایان و آقازاده ها نشیم

نظرخواهی این نوشته بسته شده است.