اطلاع دقیق از گسترش آنفلوانزا با استفاده از توییتر و خبری که نتیجه را خراب کرد

مرکز کنترل و پیش‌گیری از بیماری‌ها (United States Centers for Disease Control and Prevention) هزینه‌ی چند صد میلیون دلاری کرد که در مورد گسترش آنفلوانزا اطلاعات به دست بیاره. کارشون هم این بود که از تک‌تک دکترها خواسته بودن که آمار بیماران آنفلوانزا رو براشون بفرستن. همون زمان یک گروه با استفاده از داده‌های توییتر خیلی راحت، بدون دردسر و با هزینه‌ی کم تونستن در مورد گسترش آنفوانزا و وضعیت‌اش در اون لحظه اطلاعات به نسبت دقیق و به مراتب به‌روزتری کسب بکنن.

اما موضوع به این سادگی هم نیست. به محض این که خبر این استفاده‌ی خارق‌العاده از توییتر به روزنامه‌ها رسید، کاربران توییتر در موردش توییت کردن. چنان توییت‌ها در مورد آنفلوانزا زیاد شد که توییتر رو تحت تاثیر قرار داد و دیگه امکانش نبود با استفاده از توییتر در مورد آنفلوانزا اطلاعات قابل اعتمادی کسب کرد!

متن بالا از گفته‌های «کاوان کپس» از اداره‌ی آمار و سرشماری بود. سخن‌ران می‌گفت درسته که ممکنه داده‌های شبکه‌های اجتماعی با هزینه‌ی کم‌تر و تلاش کم‌تر بتونن نتیجه‌های به‌روزتر و دقیق‌تری تولید کنن، اما هم‌چنان مشکل پابرجاست که این داده‌ها خیلی هم قابل اعتماد نیستن و می‌تونن به همون راحتی که اومده‌ان، به همون راحتی هم برن.

3 thoughts on “اطلاع دقیق از گسترش آنفلوانزا با استفاده از توییتر و خبری که نتیجه را خراب کرد”

  1. اگه درست متوجه شده باشم اشکالی که در اینجا به این روش جمع آوری اطلاعات وارد شده تخمین بیش از حد(overestimation)موارد انفلوانزا است که بدلیل اطلاع کاربران توییتر از این نوع جمع آوری اطلاعات رخ داده.
    به نظر من این مساله مشکل اصلی مطالعه نیست و این عامل مخدوش کننده رو میشه با عدم اطلاع رسانی به افراد مورد مطالعه برطرف کرد. وفقط در پایان مطالعه نتایج رو اعلام کرد==> مطالعه یک سو کور (single blind)
    اما یه اشکال ذاتی که در این نوع جمع آوری داده از ابتدا وجود داره اینه که لزوما” تمام افرادی که انفلوانزا گرفته اند نمیان در بارش توییت کنن (مثلا” اهل توییت کردن نیستند / عدم دسترسی به اینترنت/ افراد پیر یا اطفال / ناتوانان جسمی یا ذهنی) یا اگر هم توییت میکنن ممکنه در مورد انفلوانزاشون صحبت نکنن .
    که این مساله باعث کم تخمین زده شدن(underestimation) میزان واقعی انفلوانزا میشه که یه اشکال غیر قابل رفع برای اینطور جمع آوری داده است.

  2. تصور من اینه اشکال موضوع نه overestimation و نه underestimation هستش، بلکه اعتماد به داده ها و مهمتر از اون حجم زیادی از داده های غیرقابل استفاده و غیرکاربردی هستش که حول موضوع تولید میشه و از طریق شبکه های اجتماعی بدست میاد

Leave a Reply

Your email address will not be published.