سیستم مبتنی بر دانش برای کلاسبندی متن با الگوریتم ID6NB‎

این مقاله یک الگوریتم جدید به نام ID6NB را برای توسعه درخت تصمیم ، معرفی میکند که شامل الگوریتم ID3غیر افزایشی Quinlanاست. این الگوریتم راهحلهایی برای دو مشکل ذیل ارائه میکند: وضعیتی که در آن رای گیری اکثریت تصمیم نادرست میدهد (یعنی ساخت دو نوع قانون متفاوت برای داده یکسان.) کاهش ابعاد در الگوریتم غیر افزایشی درخت تصمیمگیری، تخمین صفت مناسب برای یک گره جایی که دو یا چند صفت بهره اطلاعاتی یکسانی دارند. مشکل اکثریت به کمک الگوریتم Naive Bayesحل میشود. برای کاهش ابعاد نیز یک راه حل ارائه شده است. در نهایت، دقت طبقه بندی به شدت بهبود یافته است. آزمایش گسترده و گسترش یافته در تعدادی از مجموعه دادههای واقعی و مصنوعی نشان میدهد که ID6NB یک الگوریتم دسته بندی state-of-the-art است که نسبت به سایر روشهای یادگیری درخت تصمیمگیری، خروجی بهتری دارد.

فهرست :

مقدمه

سیستم مبتنی بر دانش

تئوری اطلاعات و کلاس بندی

کاهش ابعاد و انتخاب ویژگی

قالب بندی مقاله

کارهای مرتبط

وضعیت مسئله

کارهای پیشنهادی

رخداد استثنا در کاهش ابعاد طول

حل و فصل رخداد استثنا در کاهش ابعاد

رخداد استثنا به علت شکست رای گیری اکثریت