مقاله تشخیص متاداده ها از طریق اختلاف بین محتوای تصویر و متاداده

Image content or metadata editing software availabilit and ease of use has resulted in a high demand for automatic image tamper detection algorithms. Most previous work has focused on detection of tampered image content whereas we develop techniques to detect metadata tampering in outdoor images using sun altitude angle and other meteorological information like temperature, humidity and weather, which can be observed in most outdoor image scenes. To train and evaluate our technique, we create a large dataset of outdoor images labeled with sun altitude angle and other meteorological data (AMOS+M2), which to our knowledge, is the largest publicly available datase of its kind
محتویات تصویر و یا در دسترس بودن نرم افزار ویرایش اطلاعات فراداده و سهولت استفاده، موجب تقاضای زیاد برای الگوریتم های تشخیص خودکار تصادفی تصویر شده است. اکثر کارهای قبلی بر تشخیص محتوای محرمانه متمرکز شده است، در حالیکه ما تکنیک هایی را برای تشخیص دستکاری متاداده در تصاویر در فضای باز با استفاده از زاویه ارتفاع خورشید و دیگر اطلاعات هواشناسی مانند دما، رطوبت و هوا، که می توان در بیشتر صحنه های تصویری در فضای باز مشاهده کرد ارائه کرده ایم. 
در این مقاله
برای آموزش و ارزیابی تکنیک ما یک مجموعه داده بزرگ از تصاویر فضای باز با زاویه ارتفاع خورشید و سایر اطلاعات هواشناسی (AMOS + M2) ایجاد می کنیم که به عقیده ما بزرگترین مجموعه داده های موجود در نوع خود است. با استفاده از این مجموعه داده ها، ما مدل های رگرسیون مجزا برای زاویه ارتفاع خورشید، دما و رطوبت و مدل طبقه بندی آب و هوا برای تشخیص هر گونه اختلاف بین محتوای تصویر و ابرداده آن را آموزش می دهیم.
 
در نهایت، یک شبکه چند منظوره مشترک برای این چهار ویژگی  بهبود نسبتا 15.5٪ در مقایسه با هر یک از آنها به صورت جداگانه
نشان می دهد. ما یک تحلیل دقیق برای استفاده از این شبکه ها برای شناسایی انواع مختلف اصلاح اطلاعات مکان و زمان در ابرداده های تصویری ارائه می کنیم.
یکی از زمینه هایی که در صحت ابرداده تصویر بسیار مهم است، موارد قانونی است که در آن یک تصویر به عنوان مدرک از یک فعالیت خاص در یک زمان خاص نشان داده می شود. نشانه زمانی تصویر تنها به خودی خود قابل اعتماد نیست زیرا به راحتی قابل تغییر است. در صورت وجود، باید با برخی اطلاعات اضافی در تصویر تایید شود.ما تکنیک های اتوماتیک را برای انجام انواع مشابهی از تجزیه و تحلیل در تصاویر در فضای باز با استفاده از اطلاعات هواشناسی را ارائه داده ایم. ما بر روی موقعیت تصویر و تشخیص تایمر زمان بندی تمرکز می کنیم، زیرا این دو مهمترین عوامل در ابرداده تصویر هستند. تحقیق حاضر بر بررسی اعتبار اطلاعات مکان با تطبیق محتوای تصویر در برابر یک پایگاه داده تصویری در مقیاس بزرگ مانند تصاویر نمای خیابان های گوگل با استفاده از تکنیک های بازیابی تصویر مبتنی بر محتوا متمرکز شده است. در زیر نمونه ای از تکنیک این مقاله را با ارائه تصویر  بیان می کنیم.

نقشه های حرارت از اختلاف مطلق در پیش بینی زاویه ارتفاع خورشید هنگامی که بخش های کوچکی از تصاویر مسدود می شوند. دو عکس از یک وب کم در زمان های مختلف استفاده می شود. در مجموعه اول، می توانیم ببینیم که شبکه در هنگام تصویر در تصویر قابل توجه است. در مجموعه دوم شبکه به سطوح بازتابنده سنگ اهمیت می دهد.
در زیر نمونه ی دیگری است در زمان ها و ساعات مختلفی عکسبرداری شده است.






برای دانلود این مجموعه و مجموعه های دیگر اینجا را کلیک کنید.
منبع
دانلود مقاله Detection of Metadata

کاربرد خوشه بندی k-means در پردازش تصویر

پردازش تصاویر دارای دو شاخه عمده بهبود تصاویر و بینایی ماشین است. بهبود تصاویر دربرگیرنده روشهایی چون استفاده از فیلتر محوکننده و افزایش تضاد برای بهتر کردن کیفیت دیداری تصاویر و اطمینان از نمایش درست آنها در محیط مقصد)مانند چاپگر یا نمایشگر رایانه(است، در حالی که بینایی ماشین به روشهایی میپردازد که به کمک آنها میتوان معنی و محتوای تصاویر را درک کرد تا از آنها در کارهایی چون رباتیک و محور تصاویر استفاده شود. در معنای خاص آن پردازش تصویر عبارتست از هر نوع پردازش سیگنال که ورودی یک تصویر است مثل عکس یا صحنهای از یک فیلم.خروجی پردازشگر تصویر میتواند یک تصویر یا یک مجموعه از نشانهای ویژه یا متغیرهای مربوط به تصویر باشد.اغلب تکنیکهای پردازش تصویر شامل برخورد با تصویر به عنوان یک سیگنال دو بعدی و بکاربستن تکنیکهای استاندارد پردازش سیگنال روی آنها میشود. پردازش تصویر اغلب به پردازش دیجیتالی تصویر اشاره میکند ولی پردازش نوری و آنالوگ تصویر هم وجود دارند.

امروزه با پیشرفت های متعددی که در روش های اخذ اطلاعات گسسته مانند اسکنرها و دوربین های دیجیتالی به وجود آمده است، پردازش تصویر کاربرد فراوانی یافته است. تصاویر حاصل از این اطلاعات همواره در حد قابل توجهی دارای نویز و یا تیرگی محسوس بوده است و در مواردی نیز دارای مشکل محو شدگی مرزهای نمونه های داخل تصویر می باشد، که باعث کاهش وضوح تصویر دریافتی می گردد. به مجموعه عملیات و پردازش هایی که در راستای آنالیز تصویر در زمینه های مختلف انجام شده است،علم پردازش تصویر گویند. کاربردهای پردازش تصویر در زمینه های مختلف آورده شده است. کاربردهای صنعتی مانند کنترل کیفیت بسته بندی دارو در یک کارخانه، کاربردهای امنیتی مانند تشخیص حرکت، تشخیص اثر انگشت، تشخیص چهره و تشخیص دست خط یا امضا،  کاربردهای پزشکی مانند ارتقای ویژگی های تصاویر اشعه x، تولید تصاویر MRI از مغز و یا تصاویرمربوطه به  CTScan ، کاربردهای نظامی مانند تشخیص و هدف یابی خودکار اهداف متحرک یا ثابت توسط موشک های هوا به زمین.

در چندین پست قبل در موردالگوریتم خوشه بندی k-means  به طور کامل بحث شد. اصطلاح k-means  برای اولین بار توسط جیمز مک کوئین در سال 1967 مورد استفاده قرار گرفت، هرچند این ایده به هوگو در سال 1957 برمیگردد. الگوریتم استاندارد ابتدا توسط استوارت لوئید در سال 1957 به عنوان یک تکنیک برای مدل کد-پالس پیشنهاد شد.

خوشه بندی k-means  یک خوشه سازی آسان است حتی برای مجموعه داده های بزرگ. در برنامه ها و علوم زیادی از این خوشه بندی استفاده می شود از جمله یادگیری بی نظیر شبکه عصبی، تشخیص الگو، تجزیه و تحلیل، طبقه بندی، هوش مصنوعی، پردازش تصویر، چشم انداز ماشین، طبقه بندی اشیا بر اساس ویژگی ها، آمار زمین شناسی، پزشکی، نجوم و کشاورزی.


در زیر چند نمونه از کاربردها در پزشکی و کشاورزی را شرح می دهیم:

فلورسنس (خاصیتی فیزیکی است که برخی مواد شیمیایی آنرا دارند) چندگانه یا چندرنگی در محل هیبریداسیون (M-FISH) یک تکنیک جدید برای برچسب زدن سیتوژنیک است که می تواند برای تشخیص اختلالات کروموزومی برای سرطان و اختلالات ژنتیکی استفاده شود.

برای شناسایی ناهنجاری های کروموزومی الگوریتم خوشه بندی بهبود یافته c-means برای تقسیم بندی و طبقه بندی تصاویر M-FISH توسعه یافته است. اما الگوریتم مورد بحث در این مثال الگوریتم k-means  است که سریعتر از c-means عمل می کند.

اخیرا یک تکنیک برچسب زنی ترکیبی( M-FISH ) ایجاد شده است که در آن هر کلاس از کروموزوم ها با ترکیب متفاوتی از فلوروفورها که برای تجزیه و تحلیل کوروموزوم های انسان استفاده می شود، جذب می شود.

ایده ی مرکزی M-FISH  این است که هر کروموزوم با ترکیبی منحصر به فرد از 5 فلوراید برچسب گذاری شود. همچنین با استفاده از خوشه بندی k-means  برای انهدام می توان از یک فیلتر استفاده کرد. کارآیی و خروجی ساده از ویژگی های اساسی روش خوشه بندی k-means است.بسیاری از رویکردهای تقسیم بندی تصویر در طول سالها پیشنهاد شده است از این روش های مختلف خوشه بندی یکی از ساده ترین هاست و به طور گسترده ای در تقسیم بندی تصاویر خاکستری استفاده شده است.

جداسازی تصویر M-FISH با استفاده از الگوریتم خوشه بندی k-means نتیجه های بهتر تقسیم بندی را نسبت به سایر روش های مبتنی بر فازی ارائه می دهد. خروجی تقسیم بندی با استفاده از الگوریتم خوشه بندی k-means در شکل زیر نشان داده شده است.

تمرکز اصلی در این مثال بیشتر روی کاربرد پردازش تصویر در کشاورزی، در زمینه ی تشخیص آفات و بیماری های گیاهی میباشد. پردازش تصویر در کشاورزی بیشتر به منظور تسهیل در کار کشاورزی و افزایش مقدار تولید با استفاده از شناسایی و از بین بردن آفات قبل از مرحله ی تکثیر و آسیب زیاد به محصول انجام میشود. برای تشخیص آفات گیاهی با استفاده از پردازش تصویر از الگوریتم هایی مانند: خوشه بندی K-Means، فیلتر کردن تصویر، جمع و تفریق تصویر استفاده میشود که در ادامه به طور کامل شرح داده خواه شد. روش مورد استفاده ی ما برای عملی کردن این کار به این صورت است که کشاورز طی دوره های زمانی مشخص تصاویری از قسمت های مختلف مزرعه گرفته و آن را برای متخصص ارسال میکند. متخصص تصاویر را با استفاده از روش های ارائه شده در این مقاله بررسی کرده و نتیجه را به کشاورز برمیگرداند. روش دیگری که ممکن است برای این منظور استفاده شود کار گذاری دوربین هایی در همه جای مزرعه است تادر دوره های زمانی مشخص تصاویری تهیه کرده و برای مرکز تحیقیقات ارسال کند، هرچند این کار ممکن است دقیق تر از روش قبل باشد اما هزینه های آن به مراتب بیشتر از روش اول است و از نظر اقتصادی به صرفه نخواهد بود.

در این مثال مثل همه ی مثال  ها  در ابتدا وارد کردن تصویر و ایجاد فضای رنگی را داریم و سپس از الگوریتم خوشه بندی استفاده می کنیم.

 دو مرحله برای انجام خوشه بندی به روش K-MEANS وجود دارد، فاز با ایجاد دستگاه های مستقل تحول ساختار رنگ شروع میشود. در یک دستگاه مستقل فضای رنگی، برای تعیین رنگ بدون در نظر گرفتن دستگاهی که ان را رسم کرده از مختصات استفاده میشود. بنابراین ما ساختار تبدیل رنگی ایجاد میکنیم که فضای رنگی را تعریف کند. سپس دستگاه مستقل تبدیل رنگ که ارزش رنگ مشخص شده در تصویر را به فضای رنگی مشخص شده در ساختار تبدیل تغییر میدهد را اجرا میکنیم.
ساختار تبدیل رنگ مشخص میکند پارامتر های مختلف تبدیل را .فضای رنگ وابسته به دستگاه که در ان رنگ حاصل به تجهیزات مورد استفاده برای تولید ان بستگی دارد. برای مثال: رنگ تولید شده با استفاده از پیکسل با مقادیر RGB تغییر میکند با روشنایی و کنتراست دستگاهی که از ان استفاده میکنیم. الگوریتم خوشه بندی K-MEANS برای طبقه بندی اشیا ) پیکسل در این مورد( استفاده میشود، بر اساس مجموعه ای از ویژگی ها و تعداد طبقه ها ، طبقه بندی با به حد اقل رساندن مجموعه ی مربعات فواصل بین اشیاء و خوشه ی مربوطه یا مرکز جسم انجام شده است.  تصویر خوشه ی الوده با تاول زدن زود هنگام و خوشه ی اول ان  در شکل زیر نشان داده شده است.

نمونه ای از خوشه بندی K-MEANS برای یک برگ الوده ی مبتلا به بیماری تاول زدن  در شکل زیر نشان داده شده است.

تصاویر دیگری در مورد خوشه بندی k-means در پردازش تصویر را در زیر مشاهده می کنید.

منبع:

دانلود مفاهیم خوشه بندی

دانلود مقاله قطعه بندی کروموزوم

دانلود مقاله پردازش تصویر در آفت شناسی

دانلود مقاله Image Segmentation using K-Means

وارد کردن تصویر در Matlab و تبدیل تصاویر

Matlab میتواند فایلهای گرافیکی با فرمتهای JPEG, TIFF, GIF, BMP, PNG, HDF, PCX، XWD, ICO, CUR  را به عنوان فایل گرافیکی بخواند.

مثلاً برای وارد کردن تصویری به نام cameraman.tif به فضای Matlab کافی است از دستور imread استفاده کنیم:

MyImage=imread(‘cameraman.tif’);

توجه داشته باشید که فایلی که دستور خواندنش را میدهید باید برای برنامه قابل دسترس باشد. یعنی یا باید در مسیر (Path) Matlab باشد یا اینکه در پرونده های (folder) قرار داشته باشد که در حال حاضر برنامه به آن دسترسی دارد.

خب تا اینجا یک فایل تصویر را در محیط Matlab وارد کرده ایم. همانطور که میدانیم یک تصویر دیجیتال بر روی کامپیوتر در قالب یک ماتریس ذخیره میشود. پس MyImage مثل همه متغیرهای Matlab یک ماتریس است.

برای اینکه بدانیم فایل خوانده شده از چه فرمتی است(سیاه سفید، یا Gray Scale یا رنگی  ) و اینکه اطلاعاتی کلی راجع به تصویر بدست آوریم می نویسیم:

imfinfo(‘cameraman.tif’)

می توان به اطلاعاتی مانند اطلاعات زیر دسترسی پیدا کرد:

Filename، FileModDate، FileSize، Format، FormatVersion، Width، Height، BitDepth، ColorType،FormatSignature، ByteOrder، NewSubFileType، XResolution، YResolution، Colormap، GrayResponseUnit.

حال برای دیدن تصویر وارد شده نیز می توان از دستور زیر استفاده کرد:

imshow(MyImage)

تبدیل تصاویر:

در گام بعدی برای این که بتوانیم رنگ های موجود در تصویر را به منظور خوشه بندی از هم تفکیک کنیم باید فضای رنگ تصویر را از RGB  به سیاه سفید یا Gray Scale تبدیل نمود.

  • برای تبدیل تصویر رنگی به سیاه سفید(باینری)  از کد im2bw  استفاده می کنیم. به صورت زیر:

bw=im2bw(X,map,0.4);

imshow(bw)

bw ماتریسی است که تصویر تبدیل شده  در آن ذخیره میشود، عددی که در آن وارد کردیم درجه ی سفیدی و سیاهی را میتواند تنظیم کند و سپس دوباره از دستور imshow برای نمایش تصویر سیاه سفید استفاده می کنیم. نتیجه ی اجرای کد بالا مانند تصویر زیر است:

  • برای تبدیل تصویر رنگی به Gray Scale از دستور rgb2gray استفاده می کنیم.در تمامی این دستورات ابتدا فراخوانی تصویر را داریم سپس از این قطعه کدها استفاده می کنیم.

MyImage=imread(‘cameraman.tif’);

MyImage2 = rgb2gray(MyImage);

imshow(MyImage),imshow(MyImage2)

ابتدا تصویر را فراخوانی کردیم سپس تصویر رنگی را به Gray Scale تبدیل نموده و در ماتریس MyImage2 ذخیره کرده و در نهایت هر دو تصویر مشاهده میکنیم. نتیجه ی کد بالا به صورت زیر است:

برای دریافت پروژه ی اماده ی تبدیل تصاویر رنگی به Gray Scale اینجا را کلیک کنید.


منبع:

دانلود مقاله پردازش تصویر

دانلود مقاله اموزش متلب

دیتاست MICC

این دیتاست شامل تصاویر جعلی بدون اصلی است که تجزیه و تحلیل ناخوشایندی دارد. اما دیتاست های دیگر به این صورت نیست.

این نوع دیتاست خود شامل چند مجموعه می باشد که با ذکر آنها منظور از این جمله(شامل تصاویر جعلی بدون اصلی است) مشخص می شود.

  • MICC-F220: اولین مجموعه از این دیتاست است که شامل 220 تصویر می باشد.دارای  110 تصویر اصلی و 110 تصویر دستکاری شده است.
  • MICC-2000: این مجموعه دارای  2000 تصویر است. تصاویر اصلی و دستکاری شده در این مجموعه یکسان نیست . از 1300 تصویر اصلی و 700 تصویر جعلی تشکیل شده است. این مجموعه بسیار شبیه به مجموعه ی MICC-F220  است.
  • MICC-600: دارای 600 تصویر است که 440 تصویر اصلی و 160 تصویر جعلی دارد.

تصاویر جعلی در این مجموعه داده ها با انتخاب تصادفی یک منطقه از تصویر و کپی کردن آن بر روی تصویر پس از انجام تعدادی از حملات مختلف مانند چرخش و تغییر مقیاس(پوسته پوسته شدن) و یا ترکیبی از اینها است.

تاکید می شود این دیتاست ها  فقط شامل 2 نوع دستکاری چرخش و پوسته پوسته شدن هستند.

در زیر مثالی ازدیتاست MICC-F220 اورده شده است:

در زیر نحوه ی دقیق دستکاری شدن مشخص شده است:






در واقع تحریفاتی که در این مجموعه داده می تواند انجام گیرد مانند تصاویر بالا است.


منبع

دانلود مقاله ی A SIFT-Based Forensic Method for Copy–Move

دانلود دیتاست MICC

دیتاست COVERAGE

در میان پایگاه داده های موجود برای تشخیص جعل، دیتاست Columbia شامل تصاویر معتبر وجعلی سیاه و سفید است اما بیشتر روی جعل پیوند (به هم تابیدن) تصویر به جای کشف جعل کپی-انتقال تمرکز دارد.

دیتاست Micc شامل تصاویر جعلی بدون اصل آن است که تجزیه و تحلیل ناخوشایندی دارد.

دیتاست Grip  و دیتاست Comofod هر دو تصویر جعلی و اصلی را نشان می دهند.در میان اینها تنها Comofodترکیبات پیچیده ی تصویر جعلی را در نظر می گیرد.

COVERAGE به صراحت ماسک های تکثیر شده و جعلی  را مشخص می کند. جدول زیر دیتاست های CMFD ( کشف جعل کپی-انتقال)  را بررسی و نیاز COVERAGE را نشان می دهد.

دیتاست COVERAGE  حاوی 100 جفت تصویر اصلی و جعلی است.

برای ایجاد پایگاه داده ی COVERAGE  تصاویر اصلی با استفاده از دوربین جلوی ایفون 6 بدست آمده است. صحنه های مختلفی را گرفته ایم که که بسیار متنوع است مانند فروشگاه ه، دفاتر، مکان های تفریحی، و غیره.

یک منطقه ی مورد علاقه که حاوی دو sgo است از هر تصویر برش داده شده و در قالب TIFF به عنوان تصویر اصلی مربوط به هر جفت ذخیره می شود.  یک تصویر جعلی توسط فتوشاپ cs4 ساخته می شود و همچنان به عنوان TIFF ذخیره می شود.

شش نوع دستکاری برای تولید تصویر جعلی استفاده شده:
  • Translation: شی تکرار شده مستقیماترجمه  و بدون هرگونه دستکاری روی ناحیه، جعل شده است.
  • Scaling : شی تکرار شده توسط یک عامل از ϕ مقیاس بندی می شود سپس ترجمه می شود.
  • Rotation: یک شی تکراری در جهت عقربه های ساعت چرخانده می شود و سپس توسط θ ترجمه می شود.
  • Free-form: شی تکراری از طریق یک تبدیل آزاد تحریف شده، سپس ترجمه می شود.
  • Illumination: شی تکراری از طریق اثرات روشنایی ترجمه می شود.
  • Combination: شی تکراری از طریق بیش از یکی از عوامل فوق پیوند داده می شود.

برای بهتر  درک کردن مطالب فوق به تصاویر زیر دقت کنید:


اکنون یک مثال از این دیتاست می زنیم:

نقاط و خطوط  نشان دهنده نقاط کلیدی (یا مراکز بلوک) و جفت های همسان است.


تصویر اصلی


تصویر جعلی


برای دریافت مقاله و دیتاست COVERAGE  روی لینک های زیر کلیک کنید.

دانلود مقاله ی COVERAGE– A NOVEL DATABASE FOR COPY-MOVE FORGERY DETECTION

دانلود دیتاست COVERAGE