آموزش داده کاویپیش پردازش داده هاداده کاویکلیات داده کاوی
بررسی انواع داده Interval-Scaled/Ratio-Scaled و Discrete/Continuous (گسسته و پیوسته) در داده کاوی
در ادامه مطلب قبلی، به بررسی عنوان دادههای که در داده کاوی میپردازیم. در این مطلب دادهای Interval-Scaled/ Ratio-Scaledو Discrete/Continuous (گسسته و پیوسته) را معرفی میکنیم.
دادههای Interval-Scaled و Ratio-Scaled:
دادههای Interval-Scaled : در این نوع دادههای عددی، بین هر دو داده متوالی آن یک فاصله واحد یکسان وجود دارد، مقادیر این دادهها میتواند مثبت، منفی و صفر باشد. به عنوان مثال نمره کسب شده در یک آزمون تستی. فرض کنید هر سؤال درست سه نمره مثبت دارد و هر سؤال منفی یک نمره منفی دارد. در این صورت نمره کسب شده میتواند مثبت، ۰ یا منفی باشد. دادههای Interval-Scaled دارای ترتیب میباشند و فاصله هر دو داده متوالی با یک دیگر برابر است.
دادههای Ratio-Scaled: این دادههای دارای یک مبدأ ۰ هستند و محدوده آنها میتواند صفر و یا مثبت باشد. به عنوان مثال سابقه کاری افراد را یک داده Ratio-Scaled است. هر فرد یا سابقه کاری ندارد (۰ سال) و یا بیشتر (۱ سال، ۲ سال و …).
دادههای Interval-Scaled و Ratio-Scaled
داده های Discrete (گسسته) یا Continuous (پیوسته)
داده های Discrete : داده های Discrete می توانند از مجموعه متناهی یا یک مجموعه نامتناهی قابل شمارش مقدار خود را انتخاب کنند.
داده های Continuous : داده های که از یک مجموعه نامتناهی غیر قابل شمارش مقدار خود را انتخاب کنند.
داده گسسته و پیوسته
سه مفهوم مجموعه متناهی ، مجموعه نامتناهی قابل شمارش و مجموعه نامتناهی غیر قابل شمارش سه کلمه کلیدی هستند، آنها را با یک مثال تضویح می دهیم.
- مجموعه متناهی : مجموعه ای است که تعداد اعضای آن محدود است. مهم نیست این تعداد کم باشد یا زیاد به عنوان مثال سایز کفش .تعداد مقادیر برای سایز کشف وجود دارد محدود می باشد و معمولا از ۳۶ شروع میشه تا۵۰
- مجموعه نامتناهی قابل شمارش : مجموعه ای است که تعداد اعضای آن نا محدود است ولی عناصر آن را می توان یک تناظر یک به یک بین آنها و اعداد طبیعی برقرار نمود (اعداد طبیعی از ۱ شروع می شند تا بینهایت). به عنوان مثال شماره دانشجویی یک مجموعه نامتناهی قابل شمارش است. درسته که بینهایت است ولی اعضای اون رو میتوان به اعداد طبیعی نگاشت داد. . اگر متوجه نشدید تعریف مجموعه نامتناهی غیر قابل شمارش رو بخونید (در ادامه اومده) شاید بتونه کمک تون کنه مطلب واضحتر بشه.
- مجموعه نامتناهی غیر قابل شمارش : با یک مثال شروع میکنیم. مثال : رکورد یک دونده در ۱۰۰ متر . فرض کنید رکورد یک نفر ۱۰٫۲۰ ثانیه باشد و رکورد شخصی دیگری ۱۰٫۲۱ ثانیه باشد. چند تا رکورد بین اون دوتا می تونید بگید؟ یکی ، دوتا سه تا یا بینهایت (مثلا ۱۰٫۲۰۱ – ۱۰٫۲۰۲ – ۱۰٫۲۰۳ – ۱۰٫۲۰۴ – ۱۰٫۲۰۵ – ۱۰٫۲۰۰۱ ، ۱۰٫۲۰۰۶۵۸۹۵۳ – ۱۰٫۲۰۹۳۵۶۲۵۸۹ و …) همونطور که می بینید بین دوتا مقدار در یک مجموعه نامتناهی غیر قابل شمارش بی نهایت عدد دیگه وجود دارد. ولی توی مجموعه متناهی قابل شمارش اینطوری نیست مثلا بین ۱ و ۶۰۰۰ تعداد محدودی عدد وجود دارد. فاصله اعداد هر چقدر هم زیاد باشد باز هم تعداد بین دو تا عدد قابل شمار است ، مثلا تعداد اعداد بین ۲۰ و ۲۰۲۵۵۶۲۵۸۴۵۵۵۲۳۲۵۶۸۵۶۵۵۲۳۵۸۵۵ باز هم قابل شمار است.