بهبود مدل کاربر در وبسایت بصورت خودکار با استفاده از
معناشناسی با مفاهیم خاص دامنه
فهرست
1-1- دلایل نیاز به شخصی سازی وب.. 13
1-1-1- گرانبار شدن اطلاعات.. 13
1-1-2- نیاز به جذب مشتری پابرجای برای وب سایت.. 14
1-3- فواید سیستم شخصی سازی وب.. 14
1-4- تفاوت شخصی سازی وب با تطبیق طرح کلی سایت.. 15
1-5- طبقه بندی عملکردهای اصلی شخصی سازی وب.. 15
1-6- نیازمندیهای اصلی سیستم شخصی سازی وب.. 16
1-7- رویکرد های موجود در شخصی سازی وب.. 17
1-8- نقش وب کاوی کاربرد وب در شخصی سازی وب.. 18
1-9- نیاز به استفاده از محتوا در شخصی سازی وب.. 19
1-10- نیاز به استفاده از معنا در شخصی سازی وب.. 19
1-12- نحوه ی گردآوری مراجع. 21
1-13- رویکرد بکار رفته در تحقیق. 21
2-1- شخصی سازی وب براساس وب کاوی کاربرد وب.. 25
2-1-1- آماده سازی و مدلسازی داده 28
2-1-1-1- منابع و انواع داده 29
2-1-1-1-1-1- فرمت های ثبت.. 30
2-1-1-1-1-2- منابع داده های کاربرد 32
2-1-1-1-4- داده های کاربران. 37
2-1-1-2- آماده سازی و پیش پردازش داده ها 38
2-1-1-2-3- تشخیص مشاهده صفحه 41
2-1-1-2-4- تشخیص جلسه ی کاربر. 42
2-1-1-2-7- پیش پردازش نهایی داده های کاربرد 46
2-1-1-2-8- یکپارچه سازی داده ها از منابع گوناگون. 47
2-1-2- کشف الگو از داده های کاربرد وب.. 48
2-1-2-1- سطوح و انواع تحلیل. 48
2-1-2-2- وظایف داده کاوی بر روی داده های کاربرد وب.. 49
2-1-2-2-1- کاوش قواعد انجمنی. 50
2-1-2-2-2- کشف الگوهای ترتیبی. 52
2-1-3- استفاده از الگوهای کشف شده جهت شخصی سازی وب.. 61
2-1-4- زمینه های تحقیقاتی شخصی سازی وب.. 61
2-2-3- واژگان شناختی و رده بندی. 64
2-2-3-3- واژگان شناختی ها و رده بندی های موجود 67
2-2-3-3-1- واژگان شناختی های مربوط به یک دامنه ی خاص... 68
2-2-3-3-2- واژگان شناختی های عمومی. 68
2-2-3-3-2-1- CYC و OpenCYC.. 68
2-2-3-3-2-3- دایرکتوری های وب.. 70
2-2-3-4- زبان های نمایش واژگان شناختی. 71
2-2-4-1-1- نقاط ضعف و قوت Wikipedia. 74
2-2-4-1-2- ساختار Wikipedia. 75
2-2-4-1-3- انواع اطلاعات معنایی لغوی در Wikipedia. 76
3- کارهای انجام شده در زمینه مدلسازی کاربر در شخصی سازی وب با استفاده از محتوای وب.. 85
3-1- تکنیک های مورد استفاده 86
3-1-2- تکنیک تحلیل معنایی پنهان. 86
3-1-3- تکنیک های مربوط به محاسبه ی ارتباط معنایی دو کلمه 87
3-1-3-1- معیارهای ارتباط معنایی مهم در ساختارهای سلسله مراتبی. 87
3-1-3-1-1- رویکردهای مبتنی بر مسیر. 88
3-1-3-1-2- رویکردهای مبتنی بر محتوای اطلاعات.. 88
3-1-3-1-3- رویکردهای مبتنی بر همپوشانی متن. 89
3-1-3-2- رویکردهای محاسبه ی ارتباط معنایی دو کلمه برای روابط غیر رابطه ی هست.. 89
3-1-3-3- کارهای انجام شده در مورد محاسبه ی ارتباط معنایی دو کلمه در Wikipedia. 90
3-2- رویکردهای انجام شده در زمینه ی مدلسازی کاربر در وب سایت با استفاده از محتوای صفحات 91
3-2-1- رویکردهای بر مبنای کلمات کلیدی. 92
3-2-2-2- روش های مبتنی بر سلسله مراتب.. 94
4-2-1- مولفه ی پیش پردازش اولیه ی ثبت.. 107
4-2-2- مولفه ی استخراج کلمات کلیدی از صفحات وب سایت.. 107
4-2-3- مولفه ی استخراج مفاهیم دامنه از وب سایت.. 111
4-2-4- مولفه ی سازنده ی بردار کلمات کلیدی. 113
4-6- دیاگرام های UML قسمت های اصلی سیستم. 117
4-7- بررسی تطابق طرح پیشنهادی با صورت مساله 117
5-1- مولفه ی پیش پردازش اولیه ی ثبت.. 121
5-1-2- نحوه ی دریافت ثبت وب سرور 121
5-2- مولفه ی استخراج کلمات کلیدی از صفحات وب سایت.. 123
5-3- مولفه ی استخراج مفاهیم دامنه از وب سایت.. 125
5-4- مولفه ی سازنده ی بردار کلمات کلیدی. 125
5-6- پیاده سازی آزمایشات.. 125
6-3- بررسی درستی مولفه های سیستم. 131
6-4-1- سخت افزار مورد استفاده 132
6-4-3- تحلیل نتایج آزمایشات.. 132
7- نتیجه گیری و کارهای آینده 136
فهرست شکل ها
شکل 2-1- مولفه های برون خطی آماده سازی داده و کشف الگو...................................... 23
شکل 2-2- مولفه برخط شخصی سازی وب............................................................. 24
شکل 2-3- تراکنش HTTP.............................................................................. 25
شکل 2-4- URL و URI................................................................................ 26
شکل 2-5- مکان های جمع آوری داده های کاربرد وب............................................... 28
شکل 2-6- مثالی از مدل کردن رفتار گردشی کاربر با زنجیره ی مارکف............................... 51
شکل 2-7- مثالی از مدل کردن رفتار گردشی در یک درخت تجمعی.................................. 53
شکل 2-8- مثالی از استخراج پروفایل های تجمعی کاربرد از خوشه های تراکنش ها................. 55
شکل 2-9- بخشی از زمینه های تحقیقاتی شخصی سازی وب......................................... 58
شکل 2-10- نمونه ای از واژگان شناختی................................................................. 61
شکل 2-11- نمونه ای از یک رده بندی................................................................... 63
شکل 3-1- استفاده از SVD برای تجزیه ماتریس d * t.............................................. 83
شکل 3-2- مفسر معنایی سیستم ESA.................................................................. 87
شکل 3-3- ماتریس session-page view.......................................................... 89
شکل 3-4- تولید C-log................................................................................. 93
شکل 4-1- معماری کلی سیستم پیشنهادی............................................................. 103
شکل 4-2- جزئیات مولفه ی استخراج کلمات کلیدی................................................. 105
شکل 4-3- شبه کد مولفه استخراج کلمات کاندیدا..................................................... 106
شکل 4-4- شبه کد مولفه رتبه بندی کلمات کاندیدا.................................................... 106
شکل 4-5- جزئیات مولفه ی استخراج مفاهیم دامنه.................................................... 107
شکل 4-6- شبه کد بخش فیلتر کردن کاندیدا........................................................... 108
شکل 4-7- شبه کد مولفه سازنده بردار کلمات کلیدی.................................................. 110
شکل 4-8- شبه کد مولفه ی نگاشت..................................................................... 111
شکل 4-9- class diagram مولفه های اصلی سیستم........................................... 113
شکل 4-10- sequence diagram بخش اصلی سیستم........................................ 114
فهرست جدول ها
جدول 2-1- مثال هایی از ارتباطات لغوی در WordNet........................................... 66
جدول 2-2- منابع اطلاعات معنایی لغوی در Wikipedia........................................... 73
جدول 2-3- مقایسه ی انواع منابع معنایی لغوی جهت استفاده در شخصی سازی وب............... 74
جدول 4-1- بردارهای کلمات کلیدی صفحات وب سایت مثال1.................................... 110
جدول 4-2- بردارهای کلمات کلیدی جلسه ی داده شده در مثال1................................... 110
جدول 4-3- کلمات کلیدی و وزن های فرضی آنها در مثال 2........................................ 112
جدول 4-4- مفاهیم موجود در صفحات جلسات کاربر به همراه وزن های آنها در مثال 2.......... 112
جدول 5-1- ساختار دستور CustomLog.......................................................... 117
جدول 5-2- ساختار دستور LogFormat.......................................................... 117
جدول 6-1- نتایج آزمایشات انجام شده بر روی 100 جلسه ی تصادفی 128
دانلود پایان نامه ارشد رشته کامپیوتر - بهبود مدل کاربر در وب سایت بصورت خودکار با استفاده از معناشناسی با مفاهیم خاص با فرمت ورد