
دولت جمهوری اسلامی ایران، روز ۱۴ بهمن ۱۴۰۴ فهرستی شامل نام، نام خانوادگی، نام پدر و شش رقم سمت راست شماره ملیِ جانباختگان اعتراضات دیماه ۱۴۰۴ را در سامانهای به نام «همدردیم» منتشر کرد. این فهرست نسخه بهروز شده فایل دیگری بود که دو روز قبل از آن (یعنی ۱۲ بهمن) از سوی دولت منتشر شده بود.
در فهرست اولیه مشخصات ۲۹۸۶ نفر وجود داشت؛ در فهرست جدید تعداد نامها به ۳۰۳۹ نفر افزایش یافته است. همچنین در فهرست اول، بعضی ردیفها تکراری بودند که در فهرست دوم این موارد نیز اصلاح شدهاند.
دانلود فایل CSV فهرست اول دولت
مقامهای حکومت ایران مدعیاند که این فهرست، اعتبار آمار رسانهها و مجموعههای فعال حقوق بشر در خارج از ایران را زیر سوال میبرد و تاییدی بر این ادعای حکومت جمهوری اسلامی است که تعداد کل جانباختگان اعتراضات ۱۹ و ۲۰ دی، با احتساب ماموران امنیتی، حدود سه هزار نفر است؛ رقمی نزدیک به آنچه چند روز پیشتر به عنوان آمار رسمی بنیاد شهید اعلام شده بود: ۳۱۱۷ نفر.
نهادهای حقوق بشری و رسانههای مخالف جمهوری اسلامی، از وجود فهرستهایی با بیش از ۶ هزار تن سخن میگویند.
به طور مشخص «هرانا»، ارگان خبری مجموعه فعالان حقوق بشر در ایران میگوید (لینک بایگانی) مجموع جانباختگان تاییدشده هرانا تا روز ۱۵ بهمن به ۶۸۷۲ نفر رسیده که ۶۴۴۳ نفر از جانباختگان در دسته «معترضان» ثبت شدهاند.
البته فهرستهای دیگری هم وجود دارد. بیبیسی فارسی فهرستی راستیآزمایی تهیه کرده که تا روز ۱۶ بهمن شامل ۲۰۵ نام یکتا است. همچنین ایراناینترنشنال در صفحهای به نام «جاویدنامان انقلاب ملی ایران» (لینک بایگانی) فهرستی از کشتهشدگان دارد که تا روز ۱۶ بهمن ۱۳۲۴ نام (۱۳۱۳ نام یکتا) در آن وجود دارد.
دانلود فایل CSV فهرست بیبیسی
دانلود CSV فهرست ایراناینترنشنال
فکتنامه نیز برای اطمینان، یک نمونه آماری راستیآزمایی شده تهیه کرده که شامل نام ۶۶ جانباخته است که همه آنها در استان اصفهان و اکثرا در شهر نجفآباد کشته شدهاند. فکتنامه درستی این فهرست را با استناد به شواهدی مانند تصاویر اعلامیه و اخبار موثق از کشتهشدن آنها تایید میکند.
با این اوصاف میتوان با تطبیق دادههای سه نمونه آماری با فهرست دولت، برآوردی از جامع بودن ادعای حکومت به دست آورد.
نتایج بررسیهای دقیق فکتنامه نشان میدهد در هر سه لیست موارد نسبتا قابل توجهی وجود دارد که در فهرست دولت دیده نمیشوند.
به طور مشخص در لیست راستیآزمایی شده فکتنامه از میان ۶۶ نام، تنها ۴۶ مورد (۷۰ درصد) در فهرست دولت دیده میشوند. ۲۰ مورد هم در لیست دولت نیستند که برای ۸ مورد آن احتمال تشابه اسمی وجود دارد.
در لیست راستیآزمایی شده بیبیسی از مجموع ۲۰۵ اسم، ۱۶۶ اسم (۸۱ درصد) در لیست دولت هم دیده میشوند. ۳۹ اسم در لیست دولت نیستند که از این میان برای ۲۱ مورد احتمال تشابه اسمی وجود دارد.
در فهرست جانباختگان ایراناینترنشنال نیز از میان ۱۳۱۳ نام یکتا، ۳۳۳ مورد (۲۵ درصد) در فهرست دولت وجود ندارند: ۱۷۱ مورد به طور قطع نیستند و ۱۶۲ مورد احتمال تشابه اسمی وجود دارد. از آن اسامی ۹۸۰ جانباخته (حدود ۷۵ درصد) با فهرست دولت تا حدود زیادی مطابقت دارد.
اول تلاش کردیم با استفاده از هوش مصنوعی، دادهها را با هم تطبیق دهیم، اما پس از بررسی نتایج اولیه و مشاهده خطای نسبتا زیاد هوش مصنوعی به این نتیجه رسیدیم که نمیتوان از این ابزار استفاده کرد.
فهرستها یکسان نیستند. بهجز لیست دولت، هیچکدام از لیستها، کد یا شماره شناسایی ندارند. احتمال تکرار یا تشابه اسمی بسیار زیاد است و علاوه بر این، به دلیل پیچیدگیهای خط و زبان، از تفاوت حروف فونت گرفته تفاوت نحوه نگارش اسامی و چند بخشی بودن اسمها، احتمال خطا در تحلیل داده بسیار زیاد است.
به عنوان نمونه میتوان به این چهار مورد اشاره کرد که سعی کردیم در فرایند آمادهسازی و تحلیل دادهها آنها را برطرف کنیم.
۱- احتمال یکسان نبودن حروف و فونتها: ما برای تحلیل داده سعی کردیم فهرستها را یکسان کنیم. به طور مشخص حروف «ی»، «کاف» و نشانهها (مانند اعراب یا همزه)، فرمهای مختلف نگارش کلمات (مثلا اله و الله) حروف را حذف کردیم. تمام نیمفاصلهها را تبدیل به فاصله کامل کردیم و فاصلههای اضافی در اول و آخر متن را حذف کردیم.
۲- در نظر گرفتن احتمال وجود اسمها و فامیلهای ترکیبی: در اسامی فارسی بسیاری از اسمها ترکیبی هستند و گاه به گونههای مختلف نوشته میشوند. مثلا اسم «علیرضا»، ممکن است «علی رضا» یا «علیرضا» نوشته شود؛ یا ممکن است در ابتدای بعضی اسامی، «سید» یا «میر» وجود داشته باشد، مثل «سید عبدالله» یا «میرمحمد» اما همان اسمها در لیست دیگری بدون پیشوند نوشته شده باشند؛ یا بین پیشوند و اسم، فاصله وجود داشته باشد یا نداشته باشد. از آن سو بسیاری نامهای خانوادگی هم ممکن است جدا یا سر هم نوشته شوند؛ مثلا «علی زاده»، «علیزاده» نوشته شود. ممکن است بعضی نامهای خانوادگی پیشوند یا پسوند داشته باشند. برای همین برای تطبیق لیستها، این احتمالات را هم در نظر گرفتیم.
۳- احتمال تشابه نام: بسیاری از افراد در ایران یک نام رسمی و یک نام غیررسمی دارند و حتی در اسناد رسمی هم ممکن است از نام غیررسمی استفاده کنند. مثلا ممکن است «جواد مرادی» را همه به اسم «اشکان مرادی» بشناسند و به این اسم معرفی کنند. برای پرهیز از خطا برای همه این موارد، وضعیت «غیرقطعی» در نظر گرفتیم؛ یعنی ممکن است «تشابه نام باشد» یا نباشد.
۴- احتمال خطا در تنظیم فهرست و جاافتادگی: در بسیاری از فهرستها، بهخصوص فهرستهایی که در خارج از ایران تهیه میشوند، احتمال خطا و جا افتادگی در ثبت دادهها وجود دارد.
با این اوصاف با در نظر گرفتن شرایط و احتمال خطا، از روش ترکیبی از تحلیل داده ماشینی و دستی استفاده کردیم. برای همین، یکبار با کمک ماشین، اسامی هر کدام از لیستها را با لیست دولت تطبیق دادیم. موارد کاملا مشابه از این طریق فیلتر شدند. در مرحله دوم رشته کلمات را در دو فهرست با هم تطبیق دادیم. به این ترتیب اسامی که بخش دوم ترکیب آنها با یک اسم در لیست دولت مشابهت داشت هم فیلتر شدند. در مرحله آخر موارد باقیمانده را به صورت دستی یک به یک و با دقت و با در نظر گرفتن احتمالهای خطا، با لیست دولت جستوجو کردیم.
حکومت جمهوری اسلامی مدعی است در اعتراضات ۱۴۰۴ در ایران حدود ۳۱۱۷ نفر جان باختهاند. برای اثبات این ادعا، دولتی فهرستی از ۳۰۳۹ نام را به همراه بخشی از کد ملی منتشر کرده و ادعا میکند این فهرست صحت آمار نهادهای حقوق بشری و رسانههای خارج از ایران را زیر سوال میبرد؛ اما تحقیقات فکتنامه نشان میدهد اسامی زیادی در فهرست دولت غایب هستند.
به دلیل نبود امکان فعالیت آزاد نهادهای و رسانههای معتبر در ایران، در حال حاضر امکان شمارش دقیق آمار کشتهشدگان وجود ندارد. اما تطبیق آمار دولت با نمونههای راستیآزمایی شده، نشان از جا افتادگی قابل توجه لیست دولت دارد.
اما فراتر از این بررسی نمونههای آماری راستیآزمایی شده با لیست دولت برای این کار به طور مشخص سه لیست راستیآزمایی را با لیست دولت، به دقت تطبیق دادیم.
۱- لیست راستیآزماییشده فکتنامه: این فهرست شامل نام ۶۶ جانباخته است که همه آنها در استان اصفهان و اکثرا در شهر نجفآباد کشته شدهاند. این لیست از منابع معتبر داخل ایران به دست آمده و فکتنامه آنها را با شواهد میدانی راستیآزمایی کرده است. از این ۶۶ نام، ۲۰ مورد در فهرست دولت نیستند که از این میان برای ۸ مورد احتمال تشابه اسمی وجود دارد.
۲- لیست بیبیسی فارسی: از ۲۰۵ نام راستیآزمایی شده، ۳۹ نام در فهرست دولت دیده نمیشوند که از این میان برای ۲۱ نام احتمال تشابه اسمی وجود دارد.
۳- لیست ایراناینترنشنال: از ۱۳۱۳ نام یکتا در این فهرست ۳۳۳ مورد در فهرست دولت وجود ندارند که برای ۱۶۲ مورد احتمال تشابه اسمی وجود دارد.
با توجه به خطای نسبتا بالای هوش مصنوعی برای تطبیق اسامی، از ترکیب سیستم تطبیق ماشینی و انسانی استفاده شده و در این فرایند به اشکال مختلف نگارش اسامی، تفاوت حروف و نشانهها، فاصلهها و نیمفاصلهها و همیننطور ترکیب و ترتیب پیشوندها و پسوندها دقت شده است.