پایان نامه هرزنامه های تصویری و فیلتر آنان با استفاده از جستجو محتواي رنگ و بافت

چکیده:

هرزنامه‌ های تصویری به نامه‌های الکترونیکی ناخواسته‌ای گفته می‌شود که اکثر محتوای پیام را به صورت تصویر نشان می‌دهد. اینترنت تغییر بزرگی در نحوۀ ایجاد و تبادل اطلاعات رسانه ای بین افراد را به وجود آورده است. در طی دهۀ اخیر، نامه های الکترونیکی ناخواسته (هرزنامه‌ های الکترونیکی) در قالب های مختلف، تبدیل به یکی از جدی‌ترین مسائل برای ارائه دهندگان خدمات اینترنتی (ISP)، شرکت‌های تجاری و کاربران شده است.

از آنجا که بیشتر نرم افزارهای نامه‌های الکترونیکی به صورت پیش فرض، پیام های تصویری را مسقیماً به کاربر نشان می دهند، هرزنامه‌ های تصویری تبدیل به مؤثرترین راه برای شکست حفاظ مبتنی بر رویۀ فیلترینگ موجود شده است. در سال های اخیر، شاهد افزایش سریع حجم هرزنامه‌های تصویری بوده‌ایم. آمارهای اخیر نشان می‌دهند که هرزنامه‌ های تصویری 27% از کل تعداد هرزنامه‌ ها را در بر گرفته و در سال 2010 به 55% از هرزنامه‌های الکترونیکی رسیده است. در نتیجه، نیاز مبرمی جهت طراحی و ارزیابی روش‌های پیشرفته برای فیلترینگ ضد هرزنامه وجود دارد.

اخیراً توسعۀ سیستم تشخیص هرزنامه کارآ و الگوریتم‌های متناظر، توجه بسیاری را جلب کرده است. فعالیت‌های قبلی را می‌توان به طور کلی به دو جریان پذیرفته شده و همگانی دسته‌بندی کرد: (1) بلاک کردن مبتنی بر IP و (2) تشخیص مبتنی بر محتوا.

ایدۀ اصلی برای رویکرد‌های بلاکینگ مبتنی بر IP، ایجاد و حفظ چندین لیست سیاه از آدرس‌های IP مربوط به مشتری‌های ارسال کننده‌های هرزنامه احتمالی است که از این اطلاعات می‌توان در تعیین اینکه آیا فرستندۀ یک ایمیل باید بلاک شود یا خیر، کمک گرفت. رویه‌های مربوط به بلاکینگ مبتنی بر IP می‌توانند رویه های مبتنی بر سیاست، یا رویه های واکنشی باشند. متأسفانه، حفظ و نگهداری خودکار از یک لیست سیاه جامع در اکثر مواقع، امر بسیار دشواری است.

بیان مساله :

دلیل عمدۀ این دشواری، این است که لیست‌های سیاه فعلی ممکن است با استفاده از شناسنده‌های اینترنتی موقتی ایجاد شوند. به طور ویژه، میزبان‌های موجود در محیط سیار می‌تواند پویایی بیشتری را به وجود آورده و شرایط را سخت‌تر کنند. در مقایسه با تصاویر طبیعی، هرزنامه‌ های تصویری شامل مشخصات یکتای بسیاری هستند. هرزنامه‌ های تصویری محتواهای متنی بسیاری را در خود جای داده‌اند.

در ضمن، کنتراست رنگی تصاویر طبیعی بسیار هموار بوده و محتوای آنها می‌توانند با استفاده از توابع توزیع مصنوعی با دقت بیشتری تخمین زده شوند. در واقع، این خاصیت مناسب، امکان تشخیص پیام غیر اسپم را فراهم می‌آورد که می‌تواند از تصاویر طبیعی بعنوان یک ضمیمه استفاده کند. بعلاوه، تصاویر اسپم ممکن است با استفاده از الگوهای خاصی به وجود آمده و از این رو، شامل الگوهای رنگی و بافتی یکسانی باشند. یکی از رایج‌ترین روش‌های ایجاد تصاویر اسپم، ترکیب مجموعه‌ای از الگوهای اصلی و ایجاد خودکار میزان عظیمی از پیام‌های تکراری است. تمام شواهد حاکی از این هستند که با استفاده از ترکیب مناسب ویژگی‌های ظاهری متعدد می‌توان هرزنامه‌ های تصویری را شناسایی کرد.

چرایی مساله مقابله با هرزنامه های تصویری:

فیلترینگ هرزنامه‌ های تصویری را می‌توان به صورت کلاس‌بندی دودوئی و باینری مدلسازی کرد. هدف نهایی این کار، دسته‌بندی تصاویر ورودی به دو کلاس اسپم و غیراسپم است. این فرایند را می‌توان به دو مرحلۀ اصلی تقسیم کرد: استخراج ویژگی و کلاس بندی. در مرحلۀ اول، ویژگی‌های ظاهری باید استخراج شود تا اسپم به صورت کارآ مدلسازی شود.

طی گام بعدی یک رویۀ محاسباتی بکار گرفته می شود (مدل آماری یا طبقه‌بندهای یادگیری ماشین) تا برچسب پیام‌های ورودی بر اساس ویژگی‌های آنها تخمین زده شود. داخل این پایان‌نامه، توجۀ عمدۀ ما به روی طراحی و آزمایش رویۀ مبتنی بر محتوای مقاوم برای فیلتر کردن هرزنامه تصویری است. تز پیش رو یک سیستم تشخیص جدید جهت تسهیل کلاس بندی اسپم تصویری دقیق و مؤثر پیشنهاد می‌شود. این سیستم نه تنها قادر به ترکیب مؤثر چندین نوع از اطلاعات ظاهری در سطوح رزولوشن متفاوت است، بلکه برای پرداختن به مسئلۀ تعداد کم نمونه های آموزشی، از یک رویۀ نمونه برداری استفاده می‌کند.

**برای سفارش این پایان نامه و برآورد هزینه لطفا از پنل کاربری خود تیکت ارسال نمایید.**

ادامه مطلب

نقد و بررسی‌ها

هنوز هیچ نقد و بررسی وجود ندارد.

اضافه کردن نقد و بررسی

پایان نامه هرزنامه های تصویری و فیلتر آنان با استفاده از جستجو محتواي رنگ و بافت

چکیده:

بیان مساله :

چرایی مساله مقابله با هرزنامه های تصویری:

پایان نامه فضای ذخیره سازی SAN