The current Bet365 opening offer for new customers is market-leading bet365 mobile app You can get a free bet right now when you open an account.

تحلیل پروژه آماری(قسمت ششم)

تکنیک های داده کاوی و آماری

تکنیک های داده کاوی و تکنیکهای آماری در مباحثی چون تعریف مقدار هدف برای پیش گویی، ارزشیابی خوب و داده های دقیق (تمیز) (clean data) خوب عمل می کنند، همچنین این موارد در جاهای یکسان برای انواع یکسانی از مسایل (پیش گویی، کلاس بندی و کشف) استفاده می شوند، بنابراین تفاوت این دو چیست؟ چرا ما آنچنان که علاقه مند بکاربردن روشهای داده کاوی هستیم علاقه مند روشهای آماری نیستیم؟

برای جواب این سوال چندین دلیل وجود دارد اول اینکه روشهای کلاسیک داده کاوی از قبیل شبکه های عصبی، تکنیک نزدیک ترین همسایه روشهای قوی تری برای داده های واقعی به ما می دهند و همچنین استفاده از آنها برای کاربرانی که تجربه کمتری دارند راحت تر است و بهتر می توانند از آن استفاده کنند. دلیل دیگر آن است که معمولاُ داده ها اطلاعات زیادی در اختیار ما نمی گذارند، این روشها با اطلاعات کمتر بهتر می توانند کار کنند وهمچنین اینکه برای داده ها وسیع کابرد دارند.
در جایی دیگر اینگونه بیان شده که داده ها ی جمع آوری شده نوعاُ خیلی از فرضهای قدیمی آماری را در نظر نمی گیرند، از قبیل اینکه مشخصه ها باید مستقل باشند، تعیین توزیع داده ها، داشتن کمترین همپوشانی در فضا و زمان چون اغلب داده ها هم پوشانی زیادی دارند، تخلف کردن از هرکدام از فرضها می تواند مشکلات بزرگی ایجاد کند، زمانی که یک کاربر(تصمیم گیرنده) سعی می کند که نتیجه ای را بدست آورد. داده های جمع آوری شده بطورکلی تنها مجموعه ای از مشاهدات چند بعدی است بدون توجه به اینکه چگونه جمع آوری شده اند. در جایی پایه و اساس Data mining به دو مقوله آمار و هوش مصنوعی تقسیم شده است که روشهای مصنوعی به عنوان روشهای یادگیری ماشین در نظر گرفته می شوند. فرق اساسی بین روشهای آماری و روشهای یادگیری ماشین (machine learning) بر اساس فرضها و یا طبیعت داده هایی که پردازش می شوند. بعنوان یک قانون کلی فرضها تکنیکهای آماری بر این اساس است که توزیع داده ها مشخص است که بیشتر موارد فرض بر این است که توزیع نرمال است و در نهایت درستی یا نادرستی نتایج نهایی به درست بودن فرض اولیه وابسته است. در مقابل روشهای یادگیری یادگیری ماشین از هیچ فرض در مورد داده ها استفاده نمی کند و همین مورد باعث تفاوتهایی بین این دو روش می شود. به هر حال ذکر این نکته ضروری به نظر می رسد که بسیاری از روشهای یادگیری ماشین برای ساخت مدل dataset از حداقل چند استنتاج آماری استفاده می کنند که این مساله بطور خاص در شبکه عصبی دیده می شود. بطور کلی روشهای آماری روش های قدیمی تری هستند که به حالت های احتمالی مربوط می شوند. Data mining جایگاه جدید تری دارد که به هوش مصنوعی یادگیری ماشین سیستمهای اطلاعات مدیریت (MIS) و متدلوژی Database مربوط می شود.


معرفی کتاب :
با افزایش حجم داده ها در دنیای امروزی ، تحلیل آنها بسیار پیچیده تر شده است . این درحالی است که روش های تحلیل هر روز در حال تحول هستند تا خروجی مناسب تری دریافت شود.
این کتاب تعداد زیادی از الگوریتم ها و روش های مدرن را ارایه می کند . همه ی الگوریتم ها هم به صورت کد ارایه شده اند.
این کتاب در سه ویرایش چاپ شده است . که اخرین ویرایش تقدیم شما شده است.

photo 2017 05 23 14 06 54

تعداد کلمات ادیت شده توسط ما تاکنون ..... 13.450.594

تعداد کلمات ترجمه شده توسط ما .....234.567

تعداد مجلات طرف قرارداد ..... 23

تعداد مشتریان ...... 453


برخی از مشتریان ما: 

موسسه تحقیقات و سرم سازی رازی

دانشگاه علوم پزشکی ایلام

دانشگاه علوم پزشکی قزوین

دانشگاه علوم پزشکی اراک

دانشگاه علوم پزشکی مازندران

دانشگاه علوم پزشکی بابل

دانشگاه علوم پزشکی مشهد

دانشگاه علوم پزشکی کهگیلویه