چکیده:
هرزنامه های تصویری به نامههای الکترونیکی ناخواستهای گفته میشود که اکثر محتوای پیام را به صورت تصویر نشان میدهد. اینترنت تغییر بزرگی در نحوۀ ایجاد و تبادل اطلاعات رسانه ای بین افراد را به وجود آورده است. در طی دهۀ اخیر، نامه های الکترونیکی ناخواسته (هرزنامه های الکترونیکی) در قالب های مختلف، تبدیل به یکی از جدیترین مسائل برای ارائه دهندگان خدمات اینترنتی (ISP)، شرکتهای تجاری و کاربران شده است.
از آنجا که بیشتر نرم افزارهای نامههای الکترونیکی به صورت پیش فرض، پیام های تصویری را مسقیماً به کاربر نشان می دهند، هرزنامه های تصویری تبدیل به مؤثرترین راه برای شکست حفاظ مبتنی بر رویۀ فیلترینگ موجود شده است. در سال های اخیر، شاهد افزایش سریع حجم هرزنامههای تصویری بودهایم. آمارهای اخیر نشان میدهند که هرزنامه های تصویری 27% از کل تعداد هرزنامه ها را در بر گرفته و در سال 2010 به 55% از هرزنامههای الکترونیکی رسیده است. در نتیجه، نیاز مبرمی جهت طراحی و ارزیابی روشهای پیشرفته برای فیلترینگ ضد هرزنامه وجود دارد.
اخیراً توسعۀ سیستم تشخیص هرزنامه کارآ و الگوریتمهای متناظر، توجه بسیاری را جلب کرده است. فعالیتهای قبلی را میتوان به طور کلی به دو جریان پذیرفته شده و همگانی دستهبندی کرد: (1) بلاک کردن مبتنی بر IP و (2) تشخیص مبتنی بر محتوا.
ایدۀ اصلی برای رویکردهای بلاکینگ مبتنی بر IP، ایجاد و حفظ چندین لیست سیاه از آدرسهای IP مربوط به مشتریهای ارسال کنندههای هرزنامه احتمالی است که از این اطلاعات میتوان در تعیین اینکه آیا فرستندۀ یک ایمیل باید بلاک شود یا خیر، کمک گرفت. رویههای مربوط به بلاکینگ مبتنی بر IP میتوانند رویه های مبتنی بر سیاست، یا رویه های واکنشی باشند. متأسفانه، حفظ و نگهداری خودکار از یک لیست سیاه جامع در اکثر مواقع، امر بسیار دشواری است.
بیان مساله :
دلیل عمدۀ این دشواری، این است که لیستهای سیاه فعلی ممکن است با استفاده از شناسندههای اینترنتی موقتی ایجاد شوند. به طور ویژه، میزبانهای موجود در محیط سیار میتواند پویایی بیشتری را به وجود آورده و شرایط را سختتر کنند. در مقایسه با تصاویر طبیعی، هرزنامه های تصویری شامل مشخصات یکتای بسیاری هستند. هرزنامه های تصویری محتواهای متنی بسیاری را در خود جای دادهاند.
در ضمن، کنتراست رنگی تصاویر طبیعی بسیار هموار بوده و محتوای آنها میتوانند با استفاده از توابع توزیع مصنوعی با دقت بیشتری تخمین زده شوند. در واقع، این خاصیت مناسب، امکان تشخیص پیام غیر اسپم را فراهم میآورد که میتواند از تصاویر طبیعی بعنوان یک ضمیمه استفاده کند. بعلاوه، تصاویر اسپم ممکن است با استفاده از الگوهای خاصی به وجود آمده و از این رو، شامل الگوهای رنگی و بافتی یکسانی باشند. یکی از رایجترین روشهای ایجاد تصاویر اسپم، ترکیب مجموعهای از الگوهای اصلی و ایجاد خودکار میزان عظیمی از پیامهای تکراری است. تمام شواهد حاکی از این هستند که با استفاده از ترکیب مناسب ویژگیهای ظاهری متعدد میتوان هرزنامه های تصویری را شناسایی کرد.
چرایی مساله مقابله با هرزنامه های تصویری:
فیلترینگ هرزنامه های تصویری را میتوان به صورت کلاسبندی دودوئی و باینری مدلسازی کرد. هدف نهایی این کار، دستهبندی تصاویر ورودی به دو کلاس اسپم و غیراسپم است. این فرایند را میتوان به دو مرحلۀ اصلی تقسیم کرد: استخراج ویژگی و کلاس بندی. در مرحلۀ اول، ویژگیهای ظاهری باید استخراج شود تا اسپم به صورت کارآ مدلسازی شود.
طی گام بعدی یک رویۀ محاسباتی بکار گرفته می شود (مدل آماری یا طبقهبندهای یادگیری ماشین) تا برچسب پیامهای ورودی بر اساس ویژگیهای آنها تخمین زده شود. داخل این پایاننامه، توجۀ عمدۀ ما به روی طراحی و آزمایش رویۀ مبتنی بر محتوای مقاوم برای فیلتر کردن هرزنامه تصویری است. تز پیش رو یک سیستم تشخیص جدید جهت تسهیل کلاس بندی اسپم تصویری دقیق و مؤثر پیشنهاد میشود. این سیستم نه تنها قادر به ترکیب مؤثر چندین نوع از اطلاعات ظاهری در سطوح رزولوشن متفاوت است، بلکه برای پرداختن به مسئلۀ تعداد کم نمونه های آموزشی، از یک رویۀ نمونه برداری استفاده میکند.
**برای سفارش این پایان نامه و برآورد هزینه لطفا از پنل کاربری خود تیکت ارسال نمایید.**
آفرستان | Offerestan | آفرستان ارائه دهنده بیشترین تخفیفات و آفرها، مرجع دانلود اسکریپت، کتاب، دانلود قالب وردپرسی، افزونه های وردپرسی
هنوز هیچ نقد و بررسی وجود ندارد.