-
شماره ركورد
677
-
شماره مدرک
5
-
شماره راهنما
پ ك5
-
پديد آورنده
فرخي طامه، ماشاالله
-
نويسنده
/ماشاالله فرخي طامه
-
عنوان
ارائه يك روش دادهكاوي حجيم بر مبناي متنكاوي و آناليز احساسات بهمنظور شناسايي رفتار هكرها
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
كامپيوتر
-
محل تحصيل
دانشگاه صنعتي قم
-
دانشکده
دانشكده فني و مهندسي
-
سال تحصيل
1398
-
گروه تحصیلی
گروه كامپيوتر
-
صفحه شمار
67ص.
-
استاد راهنما
رسولي كناري، عبدالرضا
-
استاد مشاور
شمسي، محبوبه
-
موضوع ها
تحليل احساسات , متنكاوي , رگرسيون لجستيك , درخت تصميمگيري
-
چکيده
يكي از جنبه هاي مرموز و ناشناخته در انسان ها احساسات مي باشد كه در حيات اجتماعي داراي نقش مهمي است. تحليل رفتار انسان نيز با استفاده از احساسات انجام ميگيرد و بدون در نظر گرفتن احساسات تحليل رفتار بي معني است. اما در بسترها شبكه هاي مبتني بر وب، متنكاوي به عنوان يك راهكار جدي براي ارزيابي احساسات و آناليز آن مطرح است. هدف اصلي در متنكاوي، دسته بندي متون در قالب تعداد معيني از دسته -هاي از پيش تعيين شده است. يك سند ميتواند در يك يا چند دسته قرار بگيرد، اين موضوع ميتواند در قالب يك يادگيري خودكار بر روي تعدادي متن انجام و سپس در پردازش هاي بعدي بر روي اسناد مورد استفاده قرار گيرد.
يكي از كاربردهاي متنكاوي تحليل احساسات است. با توجه به حجم بالاي اطلاعات در وب و همچنين حجم بالاي توييت هاي كاربران، تحليل احساسات از اهميت ويژهاي برخوردار است. براي اين حوزه كاربردهاي زيادي را ميتوان مطرح كرد. از جمله سنجش ميزان رضايت كاربران از يك كالاي خاص و يا نظرسنجي در انتخابات سياسي را نام برد. يكي از كاربردهاي بسيار مهم ديگر در اين زمينه تشخيص كاربران عادي و كاربران خطرساز از روي توييت هاي كاربران است.
در اين پايان نامه از تحليل احساسات براي تشخيص كاربران عادي از هكرها استفاده شده است. براي اين كار در ابتدا و پس از پاكسازي دادهها از روش رگزسيون لجستيك براي طبقه بندي انواع كاربران مانند كاربران خبره و يا عادي و يا ... استفاده شده است. سپس با استفاده از روش درخت TF-IDF به دسته بندي كاربران جديد پرداخته و در انتها تحليل احساسات را بر اساس بار معنايي كلمات محاسبه ميكنيم. نتايج نشان داده است كه دقت اين روش در حدود 90.9 درصد است. نتايج نهايي بيانگر بهبود در اين زمينه نسبت به ساير روشهاي دادهكاوي مانند ماشين بردار پشتيبان و خوشه بندي است.
-
لينک به اين مدرک :