داده کاویداده کاوی برای مدیرانمطالعه موردی داده کاوی
داده کاوی در کسب و کار : آماده سازی اطلاعات مورد نیاز تحلیگران کسب و کار
زمانی مشکل یا چالشی در حوزه کسب و کار به وجود میاد، در اولین گام تحلیل گران کسب و کار باید داده ها و اطلاعاتی که برای تصمیم گیری مورد نیاز است، را شناسایی کنند. در این شرایط تحلیل گران معمولا کاری به شیوه ذخیره سازی، بازیابی و نگهداری داده ها ندارد و تنها چیزی که برای آنها مهم است این است که آیا داده های که نیاز دارند در اختیار آنها است یا خیر؟
ارائه اطلاعات و داده های ناقص به تحلیگران کسب و کار ، چندان برایشان خوش آیند نیست. آنها انتظار دارند تا داده ها به صورت کامل، بدون نقص، منظم و قاعده مند در اختیارشان قرار بگیرید. معمولا در دنیایی واقعی داده های ناقص، ناسازگار و نامعتبر بسیار وجود دارد. اینجاست که اهمیت تکنیک های داده کاوی در کسب و کار مشخص میشه. با کمک این تکنیک های سعی می شود دادههای بهینه، با توجه به معیارهای زیر، در اختیار تحلیلگران قرار داده شود
• داده های با کیفیت بالا
• داده های یکپارچه و مجتمع
• داده های مفید برای هدف تحلیل
داشتن داده های باکیفیت و جمع و جور نیاز به پیش نیازهای پردازش زیادی داره، سعی مکنیم این موارد رو بر اساس داده های واقعی یک شرکت مورد بررسی قرار بدیم.
نمونه واقعی از داده کاوی در کسب و کار (قصد داریم در این مطلب و چند مطلب آینده انواع مشکلاتی که یک شرکت در تحلیل کسب و کار رخ داده است را بررسی کنیم)
فرض کنید تحلیل گران نیاز به داده های مربوط به زمانی که یک مشتری اولین خرید خود را از شرکت انجام داده، نیاز دارند. ما داده ها را از پایگاه داده شرکت استخراج کرده ایم، به صورت زیر است:
داده های خام قبل از اعمال تکنیک های داده کاوی در کسب و کار
جدول فوق به این معنا است که
۱- ۱۴ درصد مشتریان در سال ۱۹۹۸ اولین خرید خود را از شرکت انجام داده اند
۲- ۱۴ درصد مشتریان در سال ۱۹۹۹ اولین خرید خود را از شرکت انجام داده اند
۳- ۱۷ درصد مشتریان در سال ۲۰۰۰ اولین خرید خود را از شرکت انجام داده اند
۴- ۱۲ درصد مشتریان در سال ۲۰۰۱ اولین خرید خود را از شرکت انجام داده اند
۵- ۴۳ درصد مشتریان مشخص نیست در چه زمانی اولین خرید خود را انجام داده اند.
بهترین راه برای این کار استفاده از تکنیک های پیش پردازش داده است. تکنیک های پیش پردازش داده در اینجا به صورت کامل توضیح داده شده اند.
در مطالب بعدی سعی میکنیم که بعضی از تکنیک های پیش پردازش داده را برای رفع مشکل این ۴۳ درصد ارائه بدهیم.