از دست رفتن داده ها: راه های اجتناب از آن

از دست رفتن داده به وضعیتی اطلاق می شود که هیچ اطلاعات یا مقدار داده ای برای پارامتر مورد نظر ذخیره نمی شود. تقریباً همه محققان در دوره ای از کار خود با مشکل از دست دادن داده روبرو می شوند! این موضوع چالشی واقعی است زیرا هیچ راه مناسبی برای مقابله با مجموعه داده های از دست رفته مهم وجود ندارد. این امر می تواند هنگامی اتفاق بیفتد که محققان نتوانند آزمایشی را به طور منطقی طراحی نمایند و منابع آزمایشی با ارزش اما نادر را از بین ببرند. چرا که هیچ راه بدون نقصی برای برخورد با از دست دادن مجموعه داده های اطلاعات حیاتی و یا مقادیر وجود ندارد. به علاوه، این اتفاق همچنین می تواند زمانی بیفتد که جمع آوری داده نادرست بوده یا اشتباهاتی در طول ورود داده ها اتفاق افتاده باشد.

از دست رفتن داده ها: راه های اجتناب از آن
از دست رفتن داده ها: راه های اجتناب از آن

تاثیر داده های از دست رفته به ویژه در تحقیقات کمی می تواند جدی باشد چرا که می تواند به برآورد مغرضانه پارامترهای حیاتی تحقیق و قابلیت ضعیف تعمیم دهی یافته ها منجر گردد. به علاوه، غافل شدن از اطلاعات از دست رفته می تواند به از دست دادن اطلاعات و در نتیجه قدرت آماری کم به دلیل افزایش خطاهای استاندارد گردد. بنابراین، عاقلانه است که با ایجاد فرضیاتی قابل قبول در مورد راه های از دست رفتن داده ها، این دلایل را شناسایی کنید. محققان باید طراحی قوی ایجاد کنند تا احتمال از دست رفتن داده ها به حداقل برسد.

انواع داده های از دست رفته

شرایطی را در نظر بگیرید که در آن محققی می خواهد یک پرسشنامه در مورد رقابت همکلاسی ها در دانشجویان کالج تهیه نماید. در تاریخ تعیین شده برای نظرسنجی شرایط مختلفی می تواند به از دست دادن داده ها منجر گردد.

الف. برخی از دانشجویان ممکن است به صورت تصادفی به خاطر دلایل پیش بینی نشده غیبت داشته باشند.

ب. برخی از دانشجویان ممکن است به خاطر اینکه نماینده کالج خود در مسابقات هستند غایب بوده باشند.

ج. تعداد معدودی از دانشجویان نیز ممکن است به دقت کامل به سوالات حساس پاسخ نداده باشند.

همه شرایط فوق در واقع به از دست دادن داده ها منجر می گردند. بر اساس این اطلاعات، ممکن است نتیجه گیری کنیم که از دست دادن داده ها می تواند در دو سطح واحد و مورد اتفاق بیفتد. از دست دادن داده ها در سطح واحد زمانی اتفاق می افتد که شرکت کننده ثبت نام شده برای مطالعه حاضر نشود یا از نظرسنجی خودداری کند. غرض ورزی حاصله با عنوان سوء گیری “انتخابی” شناخته می شود چرا که ممکن است پاسخ های این شرکت کننده ها متفاوت از سایر شرکت کننده ها باشد.

از طرف دیگراز دست دادن داده ها در سطح مورد به داده های ناقص جمع آوری شده از یک شرکت کننده ثبت نام شده در تحقیق اشاره دارد. برای نمونه، شرکت کننده ممکن است سوالی را جا انداخته یا به سوالات خاصی در نظرسنجی پاسخ نداده باشد.

داده های از دست رفته را می توان بر اساس دلایل یا مکانیسم هایی که به از دست دادن داده ها منجر می گردند طبقه بندی کرد.

از دست رفتن کاملا تصادفی (MCAR)

دلیل از دست رفتن داده ها ربطی به پاسخ های مشاهده شده و مفقود شده ندارد به عبارتی همه موارد احتمال از دست رفتن به میزان مساوی را دارند. این موضوع در شرایط الف نشان داده شده است که در آن دانش آموزان قادر نیستند به خاطر دلایل تصادفی پیش بینی نشده به نظرسنجی پاسخ بدهند.

از دست رفتن تصادفی (MAR)

فاکتورهایی که به از دست رفتن داده ها در این مورد منجر می شود به صورت مشروط مستقل از پاسخ های مفقود شده است. برای نمونه، مفقود شدن داده ها به خاطر سناریوی ب مستقل از متغیر مورد نظر است (به عبارتی، آیا دانشجویان در رقابت با همکلاسی ها هستند یا خیر) بلکه می تواند به متغیر مشاهده شده دیگر وابسته باشد (به عبارتی، نمرات یا تخصص آنها در فعالیت فوق برنامه خاص).

از دست رفتن غیر تصادفی (MNAR)

در این مورد، از دست رفتن داده ها هم به داده های مشاهده شده و هم به داده های از دست رفته وابسته است. سناریوی ج که در آن دانشجویان به سوالات حساس مربوط به رقابت همکلاسی ها پاسخ نداده باشند می تواند به از دست رفتن داده ها در این طبقه منجر شود.

از دست رفتن داده ها: راه های اجتناب از آن

دیدگاهتان را بنویسید

بازگشت به بالا
فارسی سازی پوسته توسط: همیار وردپرس