آنالیز آماری

تکنیک‎های داده کاوی و آماری

تکنیک‎های داده کاوی و تکنیک‎های آماری در مباحثی چون تعریف مقدار هدف برای پیش‎گویی، ارزشیابی خوب و داده‎های دقیق (تمیز) خوب عمل می‎کنند. روش‎های کلاسیک داده کاوی از قبیل شبکه‎های عصبی، روش‎های قوی‎تری برای داده‎های واقعی به ما می‎دهند و همچنین استفاده از آن‎ها برای کاربرانی که تجربه کمتری دارند راحت‎تر است و بهتر می‎توانند از آن استفاده کنند. دلیل دیگر آن است که معمولاُ داده‎ها اطلاعات زیادی در اختیار ما نمی‎گذارند، این روش‎ها با اطلاعات کمتر بهتر می‎توانند کار کنند و همچنین برای داده‎های وسیع کاربرد دارند. در جایی دیگر اینگونه بیان شده که داده‎های جمع‎آوری شده نوعاُ خیلی از فرض‎های قدیمی آماری را در نظر نمی‎گیرند، از قبیل اینکه مشخصه‎ها باید مستقل باشند، تعیین توزیع داده‎ها، داشتن کمترین هم‎پوشانی در فضا و زمان. چون اغلب داده‎ها هم‎پوشانی زیادی دارند، تخلف کردن از هرکدام از فرض‎ها می‎تواند مشکلات بزرگی ایجاد کند. داده‎های جمع‎آوری شده بطورکلی تنها مجموعه‎ای از مشاهدات چند بعدی است بدون توجه به اینکه چگونه جمع‎آوری شده‎اند.