داده کاویداده کاوی برای مدیرانمطالعه موردی داده کاوی

تکنیک های داده کاوی برای تخمین داده های ناقص کسب و کار

در این مطلب به کاربرد تکنیک های داده کاوی در کسب و کار به منظور تخمین داده های ناقص خواهیم پرداخت. توی مطلب قبل داده های یک شرکت رو مورد بررسی قرار دادیم و دیدیم بخشی از داده های اون وجود ندارد، قول داده بودیم توی مطلب بعدی روشها ی رو برای  تخمین داده های که نداریم، ارائه بدیم.  به این داده ها به اصلاح داده ای گم شده Missing Data گفته میشه. (پیش از ادامه مطلب نیاز است تا این مطلب را یک نگاه اجمالی بندازید)

همانطور که گفتیم، فرض کنید تحلیل گران نیاز به داده های مربوط به زمانی که یک مشتری اولین خرید خود را از شرکت انجام داده، نیاز دارند. ما داده ها را از پایگاه داده شرکت استخراج کرده ایم و متاسفانه اطلاعات ناقص است و برای  ۴۳ درصد مشتریان مشخص نیست در چه زمانی اولین خرید خود را انجام داده اند. (اطلاعات در شکل زیر نمایش داده شده است)

داده کاوی در کسب و کار

داده کاوی در کسب و کار : نمونه داده واقعی یک شرکت

چگونه میتوانیم این داده های گم شده را تخمین بزنیم. در ادامه سه روش رو برای این منظور ارائه می دهیم البته این روش ها محدود نیستند و در اینجا ما تعدادی از آنها را به عنوان نمونه بیان میکنیم.

  1. استفاده از مقدار میانگین خرید افرادی است که در یک سال خاص از شرکت خرید کرده اند: به عنوان نمونه فرض کنید متوسط خرید مشتریان سال ۱۹۹۸، ۱۵۰ هزار دلار است، متوسط خرید مشتریان سال ۱۹۹۹، ۱۳۰ هزار دلار است، متوسط خرید مشتریان سال ۲۰۰۰، ۱۲۰ هزار دلار است و متوسط خرید مشتریان سال ۲۰۰۱، ۱۰۰ هزار دلار است. در نتیجه می توانیم سایر مشتریان را نیز بر اساس این مقادیر دسته بندی کنیم، مثلا اگر یک مشتری ۱۳۲ هزار دلار از شرکت خرید کرده است می توانیم آن را در دسته مشتریان سال ۱۹۹۹ قرار دهیم.
  2. ایجاد یک مدل از طریق داده های است که از مشتریان داریم: ما میتوانیم بر اساس داده های مرتبط با مشتریانی که تمامی اطلاعات آنها را داریم یک مدل استخراج کنیم و سپس بر اساس آن مدل اطلاعات سایر مشتریان را تخمین بزنیم. به عنوان مثال فرض کنید ما داده ها مربوط به جنسیت مشتری، شغل مشتری، سن مشتری ،میزان متوسط خرید ماهانه مشتری و … را داریم. این اطلاعات را به عنوان ورودی به الگوریتم های ایجاد مدل می دهیم و خروجی این الگوریتم ها یک مدل است که سعی شده است تمامی ویژگی های مشتریان در آن دخیل باشند. مشتریانی که زمان اولین خرید آنها مشخص نیست را می توان توسط این مدل در دسته خاص خود قرار داد. این روش نسبت به سایر روش های دقیق تر است امام به همان اندازه نیز وقت گیر است.
  3. روش سوم که می شود گفت تقریبا ساده شده روش دوم است، استفاده از ویژگی است که در همه دسته های یک گروه مشتریان یکسان است.  فرض کنید تمام مشتریانی که لباس  بسکتبال می خرند مرد هستند. در نتیجه می توان با کمک این قانون مشتریانی که جنسیت آن مشخص نیست و لباس بسکتبال خریده است “مرد” در نظر گرفت. نکته مهم در مورد این روش آن است که نمی توان از آن برای پیش بینی مشتریانی که لبسا بسکتبال نخریده اند استفاده کرد. به عبارت این قانون در مورد مشتریان که جنسیت آنها مشخص نیست و لباس بکستبال نیز نخریده اند کاربرد ندارد و نمی تواند در تعیین جنسیت مشتری کارآمد باشد.
 در این مطلب سعی کردیم تکنیک های تخمین داده ها که از مهمترین روشهای داده کاوی در کسب و کار هستند رو بررسی کنیم. در مطالب بعدی، سایر مشکلات مربوط به داده ها و اهمیت مشاوران داده کاوی در کسب و کار را بررسی خواهیم نمود.
برچسب ها

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

بستن