Jun
17
هماین چند دقیقه پیش در فیسبوک دیدم که دوستی یک لینک از خبرگزاری انتخاب گذاشته دربارهی یک تحلیل آماری از انتخابات. نویسندهی این تحلیل با استناد به قانون بنفورد نتیجهگیری کرده که احتمال تقلب در انتخابات بالای ۹۹ درصد است. متأسفانه این تحلیل یک مشکل سادهی محاسباتی دارد.
طبق قانون بنفورد، احتمال این که رقم دوم از سمت چپ یک داده در دنیای واقعی ۲ باشد برابر ۰٫۱۰۸۸۲ است. در انتخابات این دورهی ریاست جمهوری وزارت کشور آمار ۳۶۶ شهرستان را اعلام کرد. پس احتمال این که رقم دوم از سمت چپ آرای هر کاندید ۲ باشه برابر ۴۰ هست. متأسفانه نویسندهی این تحلیل آماری، این عدد را به اشتباه ۷۳ حساب کردهاند. هماین عامل باعث شده که توان دوم خی بزرگ باشد و نویسنده خیال کند که تقلبی صورت گرفته.
راستاش من دو روز بود که داشتم روی نتایج انتخابات و مقایسهی آنها با قانون بنفورد کار میکردم. جدا از این که چرا قانون بنفورد برای نتایج انتخابات کار میکند، من چیز مشکوکی در نتایج ندیدم و بعید میدانم بشود از این روش به نتیجهی محکمی دربارهی تقلب رسید.
تکمیلی: خانم مریم لینکی به یک مقاله در arXiv فرستادهاند که توصیه میکنم حتمن نگاه بکنیداش. این مقاله آمده است و به جای استفاده از قانون بنفورد برای رقم دوم از سمت چپ، از فرم سادهی قانون بنفورد برای رقم اول استفاده است. خلاصهی نتیجهی مقاله این است که آرای آقای کروبی مشکوک است. چرا؟ چون فراوانی ۷ به عنوان رقم اول بیش از دو انحراف معیار بیشتر از آنی است که باید باشد. جالب اینجاست که من هم یک بار دربارهی عدد ۷ در این وبلاگ نوشته بودم. هر وقت صحبت از عدد تصادفی میشود، ذهن آدم به سمت ۷ متمایل میشود. آیا این نشان میدهد که یک نفر آرای آقای کروبی را دستی وارد کرده است؟ نمیشود با قطعیت گفت ولی سرنخ خیلی خوبی است.
خانم پانتهآ لینک دیگری فرستادهاند از یک نفر در دانشگاه میشیگان (فرمت PDF). ایشان در مقالهای نتایج انتخابات را تحلیل آماری کرده ولی در نهایت نتیجه گرفته که دادههای موجود برای تشخیص تقلب کافی نیست. بهنظر باید نتایج با تفکیک بیشتری، مثلن در حد حوزه یا صندوق، موجود باشد تا بتوان نتیجهی دقیقتری گرفت.
بچه ها لطفا این پست رو توی فیس بوک شر کنید
اخه چرا هی میخاهید این نتایج رو علمی و موجه جلوه بدید:(
به صورتک خیالی: منظورتون من هستم؟ باور کنید من نمیخوام چیزی رو علمی جلوه بدم. فقط دیدم این تحلیل غلط میتونه منجر به ضررهای بعدی بشه.
البته شاید دیده باشین
http://www.fivethirtyeight.com/2009/06/iran-does-have-some-fishy-numbers.html
یکی دو تا مطلب دیگه هم داره در مورد انتخابات ایران. گفتم پرتاب کنم اینجا شما هم نظر بدین D:
http://www-personal.umich.edu/~wmebane/note14jun2009.pdf
این رو هم یکی از بچهها لینک داد
http://www-personal.umich.edu/%7Ewmebane/note17jun2009.pdf
از اینجا:
http://www-personal.umich.edu/~wmebane/
با عنوان
Note on the presidential election in Iran, June 2009
نامی جان، لینک به انتخاب رو نمی تونم باز کنم- همین مقاله است؟
http://arxiv.org/abs/0906.2789
حرف شما درمورد اشتباه محاسباتی سایت انتخاب کاملا درست است.به همین دلیل من همین آزمایش را برای 100 شهربه صورت رندوم واین بار با اطلاعات درست تکرارکردم( منبع آرای هر کاندید از سایت وزارت کشور) نتایج به دست آمده:
احتمال دستکاری آرا:احمدی نژاد %96.86
رضایی 96.62
کروبی 97.43
موسوی 98.22
آقای علیرضا خوب چرا برای همه شهرها انجام نمیدید؟
به ar: بله این رو دیده بودم. ولی بازهم ممنون که اینجا گذاشتید.
به پانتهآ: ممنون. گزارش خیلی خوبی است.
به مریم: نه همون نیست. مقالهی آرکایو رو نگاه کردم. استدلال این مقاله جالبتر از کار سایت انتخاب هست.
به علیرضا: جدی به این نتایج رسیدید؟ اگر نتایج رو به صورت جدول یک جایی بنویسید خیلی خوب میشه. من هم میتونم بهاش لینک بدم.
اشکالی که به محاسبه وارد کردید درسته. اما اصل فرمولی که آقای رستگاری بکار برده ربطی به مرحوم بنفورد نداره. احتمال وقوع رقم ضرب در تعداد شهرها؟؟
http://www.entekhabnews.us/portal/index.php?news=6435
به پیکولو: منظورتون از اصل فرمول کدام فرمول هست؟ من به نظرم رسید که ایشان از فرض صفر به همراه قانون بنفورد استفاده کردهاند.
مقاله ای منتشر شده از اقایی به نام
Boudewijn F. Roukema
تحت عنوان
BENFORD’S LAW ANOMALIES IN THE 2009 IRANIAN
PRESIDENTIAL ELECTION
احتمالا تا الان دیدینش. نظرتون در موردش چیه؟ قابل استناد برای اثبات وجود تقلب هست؟
ham nevisande maghale roznameh entekhab ham shoma yek pish farz asli darid va an in ast ke argham elam shode nashi az shomaresh ara mibashand dar sorati ke aslan momken ast ke amar asli dar zir zamin vezarat keshvar bashand va serfan “adad sazi” sorat gerefte bashad
[...] صرفا بررسی عددها با ملاکهای آزمون بنفورد میتواند موید تقلب در انتخبات [...]
برادر تنها اشتباه نویسنده ی اون مقاله، عدد 70 نبوده.
احتمال 5% برای درست بودن نتایج، برای chi-square بالای 16.92 هست نه 1.69 که توی مقاله استفاده شده.
در ضمن، تقریباً همه ی فراوانی های ارقام توی اون مقاله اشتباه هستند. مثلاً فراوانی 3 در رقم دوم اعداد برای تمام کاندیداها اشتباهه. توی اکسل می تونین این اعداد رو محاسبه کنین.
اگر این ها رو در نظر بگیرین، اعداد به دست اومده این طور می شن:
به ترتیب برای:
احمدی نژاد - رضایی - کروبی - موسوی
6.12015086 - 20.26427986 - 6.651039449 - 14.13678614
و احتمال تقلب (فقط طبق روش های آماری، که به تنهایی دلیل نیست):
27.21% - 98.36% - 32.65% - 88.24%
به حامد: خانم مریم این را معرفی کرده بودند و من یک توضیح تکمیلی در موردش نوشتم. سواد آمار من خیلی بالا نیست ولی به نظرم مقالهی جالبی آمد.
به سید: ممنون که اشتباهات دیگر را هم گوشزد کردید. به نظرم نویسندهی مقالهی انتخاب کمی با عجله نتایج رو منتشر کرده است.
نکته مهم اینجاست که آقایان بسیار هوشمندانه عمل کرده اند و آمار را به نفع خود تغییر داده اند. چرا؟
چون استفاده از قانون بنفرد برای داده هایی برقرار است که توزیع نرمال نداشته باشد. درصورتی که داده های شهری به این علت که مجموع داده های بیش از 30 صندوق است دارای توزیع نرمال است و قانون بنفرد در مورد آن صدق نمی کند و باید این محاسبات به حساب زیرکانه آقایان روی صندوقهاصورت پذیرد و نه روی داده های شهری.! تنهایک مقدار دقت لازم دارد تا آمارهای مجعول آقایان دروغگو که شعارشان “دروغ ممنوع” است مشخص شود.
این مقالات را هم ببینید:
http://www.fivethirtyeight.com/2009/06/iran-does-have-some-fishy-numbers.html
http://www.juancole.com/2009/06/stealing-iranian-election.html
http://www.slate.com/id/2220608/pagenum/all/#p2
بعد از اونهمه آماری که دکتر تو تلویزیون داد، من کلاً نسبت به درستی بحث های آمار و احتمال به شک افتادم شدید!
دوستان عزیز رای مردم همین 4 تا جون که تو اینترنت و خیابان تهران هستند نیست … اکثرا” به احمدی نژاد رای دادن
مردم اکثرا گشنه هستن و از دزدیهای هاشمی و خاتمی خسته .
این قماش فقط بلدن حرف خوب بزنن
مثل موسوی که حتی یه برنامه درست تا روز آخر نداده بود
واقعا برای مردم کوته فکرمون متاسفم .
ضمنا” فکر میکنین انقلاب شدن به آسانی انقلاب 57 که 99 درصد با خمینی بودن ؟
این شلوغیها نتیجش جنگ داخلی سپس هجوم بیگانه ها و در آخر خوردن گوشت همدیگس …. اونایی هم که خارج از کشور دارن الکی شعار میدن مسئول این بدبختی و کشتار خواهند بود …
اگه تقلب نشده بود نيازی به قطع کردن پيام کوتاه نبود. با پشتوانه 24 ميليونی که نيازی به اين کارها نيست.
اون چيزی که من می فهمم اينه که حاکميت يه چيزی رو پنهان کرده که از اطلاع رسانی مردمی می ترسه.
شايار! دوتا نکته:
1- منظورت اينه که از ترس لولوی بيرون ده بايد هرکاری که کدخدا کرد هيچی نگيم!
2- سالم ترين دوران اقتصادی رو در دوران خاتمی داشتيم. اگه خاتمی کوچکترين فساد مالی داشت قطعاً محمود اون رو مطرح می کرد. مراقب باش که تهمت گناه کوچکی نيست.
مجتبی مطمئنی این موضوع رو ؟
چند نمونه از قرار دادهای گازی رو میخوای برات نام ببرم که به قول خودشون قرار داد ترکمنچای بوده در این زمان آقای خاتمی ؟ !
مطمئن باش اگه دم این بابا گیر نبود الان مثل موش تو سوراخ نبود
من طرفدار هیچ گروه و فرقه ایی نیستم . طرفدار منطق و میهنم …
خائن ترین آدم به نظر من همین خاتمی بود که از رای مردم سوءاستفاده کرد و خیانت کرد به اعتماد مردم نه این احمدی نژاد که همه بهش بد و بیراه میگن ولی بازم کار مثبت به اندازه کل هشت سال اساتید انجام داد …
بهتره عوض تبلیغات منفی که میبینیم یکم چشمونو باز کنیم و بازیچه قدرت آقایان و آقازاده ها نشیم