داده کاوی

تکنیک های تخمین داده های ناموجود (Missing Values) – قسمت دوم

داده های گم شده

قبل از اینکه مطلب رو ادامه بدیم، ابتدا یک نگاه بندازیم ببینیم دقیقا ما کجا هستیم.  در چرخه داده کاوی ما در گام پیش پردازش هستیم. و داریم تکنیک های مربوط به تخمین داده های گم شده یا داده های ناموجود رو بررسی می کنیم. دسته بندی کلی تکنیک های …

ادامه نوشته »

پیج رنک گوگل ، نمونه کاربرد الگوریتم های داده کاوی

پیج رنک گوگل

توی مطلب قبلی در مورد PageRank صحبت کردیم. توی این مطلب یکی از کاربردهای این معیار مرکزیت رو بررسی میکنیم. یکی از ممهترین نمونه های PageRank  رو میشه استفاده اون در جستجوی سایت معرف گوگل دونست. شاید شما هم تا حالا واژه های مانند پیج رنک گوگل ،  الگوریتم PageRank …

ادامه نوشته »

پاکسازی داده ها – تخمین داده های ناموجود Missing Values

داده های ناموجود

همانطور که در مطلب قبل بیان کردیم پیش پردازش داده ها دارای 4 گام اصلی می باشد  1- پاکسازی داده (data cleaning)، 2- یکپارچه سازی داده (data integration)، 3- کاهش داده (data reduction) و در نهایت تبدیل داده (data transformation).   پاکسازی داده اولین بخشی که قصد درایم در مورد …

ادامه نوشته »

متخصصان داده کاوی و تحلیل گران کسب و کار: اماده سازی داده ها برای تصمیم گیری

داده کاوی و کسب و کار

درباره ارتباط داده کاوی و کسب و کار قبلا بیان کردیم، وقتی مشکلی در کسب و کار پیش می آید، تحلیل گران، داده های مورد نیاز برای تصمیم گیری را تعیین میکنند . دو تا از مشخصه های که برای توسط تحلیگران معمولا تعیین میشود کیفیت داده ها و چگونگی …

ادامه نوشته »

مرکزیت PageRank در داده کاوی شبکه اجتماعی

PageRank

همانطور که گفتیم قصد داریم تا با انواع معیارهای مرکزیت در شبکه های اجتماعی صحبت کنیم. مرکزیت یعنی اینکه بتوانیم تشخیص دهیم کدام گره ها در شبکه اجتماعی مهم هستند. ما می توانیم مرکزیت در شبکه های اجتماعی را از چندین دیدگاه مورد بررسی قرار دهیم و  تا حالا “درجه …

ادامه نوشته »

پیش پردازش داده‌ها : پاکسازی داده، یکپارچه سازی داده، کاهش داده و تبدیل داده

پیش پردازش داده‌ها

همانطور که توی قول داده بودیم قصد داریم مهمترین تکنیک های پیش پردازش داده‌ها رو با جزییات بیشتری بررسی کنیم. در مطلب قبل چرخه داده کاوی رو معرفی کردیم و گفتیم که پیش پردازش داده‌ها اولین گام در داده کاوی است. در این مطلب مهمترین تکنیک ها پیش پردازش داده …

ادامه نوشته »

مرکزیت بردار ویژه در داده کاوی شبکه اجتماعی (Eigenvector centrality)

همانطور که گفتیم قصد داریم تا با انواع معیارهای مرکزیت در شبکه های اجتماعی صحبت کنیم. مرکزیت یعنی اینکه بتوانیم تشخیص دهیم کدام گره ها در شبکه اجتماعی مهم هستند. ما می توانیم مرکزیت در شبکه های اجتماعی را از چندین دیدگاه مورد بررسی قرار دهیم و اولین دیدگاه “درجه …

ادامه نوشته »

چرخه داده کاوی

توی مطالب که تا اینجا در مورد داده کاوی گفتیم هدف ما این بود که یک سری پیش نیاز از داده کاوی رو ارائه بدیم. این پیش نیاز ها برای ادامه مسیر بسیار ضروری است پس نیاز است تا یک نگاهی به اونها داشته باشید. از اینجا به بعد قصد …

ادامه نوشته »

متخصصان داده کاوی و تحلیگران کسب و کار

متخصصان داده کاوی

ما در دو مطلب گذشته دو نمونه از مشکلات حوزه کسب و کار را بررسی کردیم و تکنیک های داده کاوی را برای رفع آنها ارائه کردیم (مطلب 1 – مطلب 2). در این مطلب قصد داریم ارتباط متخصصان داده کاوی را با کسب و کار بیشتر بررسی کنیم. در …

ادامه نوشته »

پیش پردازش داده ها : نکات تکمیلی در مورد داده های ناقص، ناسازگار و غیر دقیق

داده های ناقص، ناسازگار و غیر دقیق

در این مطلب آخرین تکنیک ها و فعالیت های مرتبط با داده های ناقص، ناسازگار و غیر دقیق را مورد بررسی قرار می دهیم. در مطالب گذشته موارد زیر را بررسی کردیم هدف پیش پردازش داده (Data Preprocessing) ایجاد داده های کامل، سازگار و دقیق پیش پردازش داده ها : …

ادامه نوشته »