تکنیکهای داده کاوی و آماری
تکنیکهای داده کاوی و تکنیکهای آماری در مباحثی چون تعریف مقدار هدف برای پیشگویی، ارزشیابی خوب و دادههای دقیق (تمیز) خوب عمل میکنند. روشهای کلاسیک داده کاوی از قبیل شبکههای عصبی، روشهای قویتری برای دادههای واقعی به ما میدهند و همچنین استفاده از آنها برای کاربرانی که تجربه کمتری دارند راحتتر است و بهتر میتوانند از آن استفاده کنند. دلیل دیگر آن است که معمولاُ دادهها اطلاعات زیادی در اختیار ما نمیگذارند، این روشها با اطلاعات کمتر بهتر میتوانند کار کنند و همچنین برای دادههای وسیع کاربرد دارند. در جایی دیگر اینگونه بیان شده که دادههای جمعآوری شده نوعاُ خیلی از فرضهای قدیمی آماری را در نظر نمیگیرند، از قبیل اینکه مشخصهها باید مستقل باشند، تعیین توزیع دادهها، داشتن کمترین همپوشانی در فضا و زمان. چون اغلب دادهها همپوشانی زیادی دارند، تخلف کردن از هرکدام از فرضها میتواند مشکلات بزرگی ایجاد کند. دادههای جمعآوری شده بطورکلی تنها مجموعهای از مشاهدات چند بعدی است بدون توجه به اینکه چگونه جمعآوری شدهاند.