فهرست مطالب
عنوان ............................................................................................... صفحه
فصل اول: معرفی نامه
1-1- معرفی فصل دوم پایان نامه........................................................................................... 2
1-2- معرفی فصل سوم پایان نامه............................................................................................ 7
فصل دوم:روش های متفاوت تقسیم بندی صفحات وب
2-1- تقسیم بندی صفحات وب بطور مختصر............................................................................ 9
2-1-1-1- روش خلاصه سازی تعدیل شده Luhn............................................................... 10
2-1-1-2 – روش تحلیل معنایی نهفته (LSA)....................................................................... 12
- 2-1-1-3- شناسایی مضمون بدنه اصلی توسط تجزیه و تحلیل لایهای.................................. 13
- 2-1-1-4- خلاصه سازی نظارت شده................................................................................... 15
2-1-1-5- یک دسته بندی کلی از خلاصه سازی................................................................... 17
2-1-2- آزمایشات.............................................................................................................. 18
2-1-2-1- مجموعه ی داده.................................................................................................. 18
2-1-2-2- دسته کننده ها.................................................................................................... 19
2-1-2-3- مقیاس ارزیابی.................................................................................................... 21
2-1-2-4- نتایج و تحلیل های تجربی................................................................................... 22
2-1-2-5 مورد پژوهش....................................................................................................... 29
2-1-3- نتیجه گیری و عملکرد آینده................................................................................... 31
2-2- تقسیم بندی صفحات وب با استفاده از الگوریتم اجتماع مورچه ها................................... 32
2-2-1- پیش پردازش متنی وابسته به زبان شناسی و استخراج وب......................................... 32
2-2-2- الگوریتم Ant- Miner......................................................................................... 36
2-2-3- نتایج محاسباتی...................................................................................................... 39
2-2-3-1- تنظیم بصورت عملی........................................................................................... 39
2-2-3-2- نتایج تأثیر تکنیک های پیش پردازش متنی وابسته به زبان شناسی.............................. 40
2-2-4- بحث و تحقیقات آینده............................................................................................ 43
2-3- تقسیم بندی صفحات وب براساس ساختار پوشهای......................................................... 44
2-3-1 الگوریتم های تقسیم بندی صفحات وب...................................................................... 45
2-3-2- روش مبتنی بر ساختار............................................................................................. 47
2-3-3- یک کاربرد خاص.................................................................................................. 47
2-3-3-1- استخراج مهمترین خصوصیات............................................................................. 48
2-3-3-2- عمل دسته بندی.................................................................................................. 50
2-3-4 نتایج....................................................................................................................... 51
2-3-5- نتیجه گیری و عملکرد آینده.................................................................................... 53
فصل سوم : جستجوی وب با استفاده از طبقه بندی خودکار
3-1- معماری .................................................................................................................... 57
3-1-1- دسته کنندهی خودکار ............................................................................................ 57
3-1-2-واسط جستجو......................................................................................................... 58
3-2- آزمایش معتبر سازی................................................................................................... 59
3-2-2- برپایی آزمایش ..................................................................................................... 60
3-2-2- نتایج تجربی.......................................................................................................... 61
3-3- فهرست لغات هر دسته................................................................................................ 64
3-3-1- تشخیص هرزنامۀ¹ وب............................................................................................ 66
3-3-2- تأثیرات تبعیضات................................................................................................... 67
3-4- عملکردهای بعدی
پایان نامه کارشناسی رشته کامپیوتر - تقسیمبندی صفحات وب با فرمت word