پایان نامه کارشناسی ارشد آقای مهرداد باقری با عنوان «برچسبگذاری تصاویر بدون نمونه آموزشی با کمک شبکههای عصبی بازگشتی»
پایان نامه کارشناسی ارشد آقای مهرداد باقری با عنوان «برچسبگذاری تصاویر بدون نمونه آموزشی با کمک شبکههای عصبی بازگشتی»
دانشکده فنی و مهندسی
گروه آموزشی مهندسی کامپیوتر
اطلاعیه دفاع از پایان نامه کارشناسی ارشد در رشته مهندسی کامپیوتر گرایش هوش مصنوعی
عنوان:
برچسبگذاری تصاویر بدون نمونه آموزشی با کمک شبکههای عصبی بازگشتی
استاد راهنما:
جناب آقای دکتر محرم منصوریزاده
استاد مشاور:
جناب آقای دکتر میرحسین دزفولیان
اساتید ممتحن:
جناب آقای دکتر حسن ختنلو
جناب آقای دکتر مهدی سخائینیا
پژوهشگر:
مهرداد باقری
زمان:
چهارشنبه 24/11/1397 ساعت 11 صبح
مکان:
سمینار 2 دپارتمان برق (سالن مهندس مرحوم خانمحمدی)
Bu-Ali Sina University
Faculty of Engineering
Department of Computer Engineering
Thesis submitted for Master of Science in computer Engineering-Artificial Intelligence
Title:
Zero Shot Image Tagging by Recurrent Neural Networks
Supervisor:
Dr. Muharram Mansoorizadeh
Adviser:
Dr. Mir Hossein Dezfoulian
Judges:
Dr. Hassan Khotanlou
Dr. Mahdi Sakhaeinia
Author:
Mehrdad Bagheri
February 13, 2019
چکیده:
روشهای متداول برای برچسبزنی تصاویر از مجموعهدادگانی استفاده میکنند که به ازای هر تصویر یک یا چند برچسب محیا شده است. این در حالی است که امروزه برچسبهای مختلفی از سوی کاربران فضاهای مجازی (Flickr، Instagram و ...) به تصاویر نسبت داده میشود. حال آنکه جمعآوری این برچسبها و بهروزرسانی مجموعهدادهها، کاری بسیار چالشبرانگیز و پرهزینه است. از این رو در سالهای اخیر، مسئله انتساب برچسبهای نوین به تصاویر و یا برچسبزنی تصاویر بدون نمونه آموزشی، توجه محققین را به خود جلب کرده است.
در این پایاننامه، در دو مرحله به تولید برچسبهای نوین برای تصاویر مجموعهداده Cifar100 پرداختهایم. در مرحله اول از شبکههای عصبی بازگشتی و همچنین ساختار سلسله مراتبی برچسبها، برای تخمین محتملترین برچسب به ازای تصاویر، استفاده کردهایم. شبکههای عصبی بازگشتی به دلیل حفظ اطلاعات مراحل پیشین برای کار با دادگان متوالی و یادگیری الگوی موجود در آنها بسیار مناسب میباشند. همچنین این شبکهها مولد/زایشی بوده و میتوان از آنها برای تولید برچسبهای نوین هم در حوزه دامنهبسته و هم در حوزه دامنهباز، استفاده کرد. در این راستا، ابتدا توسط شبکه عصبی ResNet، بردار ویژگی تصاویر استخراج شده و سپس توالی بردار ویژگی و برچسبهای تصاویر (با الگوی کلی به جزئی) به عنوان دادگان متوالی برای یادگیری شبکه بازگشتی در نظر گرفته شدهاند. به این ترتیب، با استفاده از شبکه عصبی بازگشتی و همچنین با کمک الگوی موجود در توالی برچسبها، محتملترین برچسب جزئی، به ازای هر تصویر، تخمین زده میشود. در مرحله دوم، به ازای برچسبهای تخمین زده شده توسط شبکه عصبی بازگشتی و با استفاده از فضای معنایی کلمات (یادگیری شده توسط مدل تبدیل کلمه به بردار)، به تولید برچسبهای نوین به ازای تصاویر مجموعهداده Cifar100 پرداختهایم. برای آموزش مدل تبدیل بردار به کلمه، از دو مجموعهداده Flickr و GoogleNews به عنوان دادگانمبدأ استفاده شده است. برای ارزیابی برچسبهای نوین تولید شده، از والدین برچسبهای فاز آموزش در ساختار درختی WordNet استفاده کردهایم. یعنی برچسبهای نوین تولید شده با والدین به دست آمده توسط ساختار درختی WordNet مقایسه میشوند. دلیل انتخاب والدین این است که برای مثال اگر برای یک تصویر "سیب" برچسب جدید "میوه" را تولید کنیم؛ از لحاظ معنایی برچسب تولید شده صحیح است. اما عکس این قضیه صادق نیست. در مجموع، نتایج حاصل از پیادهسازی، نشان میدهد که روش پیشنهادی برای برچسبزنی تصاویر بدون نمونه آموزشی و تولید برچسبهای نوین از دقت قابل قبولی برخوردار است.
واژههای کلیدی: برچسبزنی تصاویر، شبکه عصبی بازگشتی، رزنت، وردنت، نادیده
Abstract:
Common methods for image tagging use datasets that contain one or more labels for each image. Meanwhile, nowadays different labels are attributed to images by social media users like instagram and flicker, etc. however collecting these labels and updating datasets is a very challenging and costly task.Hence in the recent years, the task of assigning new labels to images or zero shot image tagging, has attracted the attention of a lot of researchers to itself.
In this thesis, we have focused on generating new labels for the Cifar100 dataset. The proposed method contains two steps. In the first step, we used recurrent neural networks as well as the hierarchical structure of labels to estimate the most probable label for the images. Recurrent neural networks are suitable for sequential data and learning their underlying patterns due to their ability to preserve information from the previous stages. These networks are also generative/productive and can be used to generate new labels in open domains as well as closed domains. In this regard, first using the ResNet neural network, the feature vector of images are extracted and then the sequence of feature vectors and image labels (coarse to fine) is used as sequential data to train the recurrent neural network. Therefore, using the recurrent neural network and also with the help of underlying patterns in the label's sequence the most probable partial label is estimated for each image. In the second step, for the labels estimated by the recurrent neural network and using the word semantic space (learnt by the word2vec model), new labels for the images of Cifar100 dataset are generated. In order to train the word2vec model, two Flickr and GoogleNews datasets have been used as source data. To evaluate new generated labels, The parents of train phase labels in the WordNet tree structure, were used. In other words, the new generated labels are compared to the parents acquired by the WordNet tree structure. The reason for choosing the parents is that if for example for an image of an "apple" we generated the new label "fruit", this new label is semantically right. But it would not be right for the other way. In general, the experimental results show that the proposed method for zero shot image tagging and generating new labels, has an acceptable performance.
Key Words: Image Tagging, Recurrent Neural Network, ResNet, WordNet, Zero Shot
نام و نام خانوادگی : مهرداد باقری
رشتهی تحصیلی : هوش مصنوعی و رباتیک
مقطع تحصیلی : کارشناسی ارشد
اطلاعات تحصیلی :
1- کارشناسی ارشد :
کارشناسی ارشد مهندسی کامپیوتر گرایش هوش مصنوعی ، دانشگاه بوعلی سینا همدان (در حال تحصیل ورودی 1395)
معدل : 16.52
2- کارشناسی :
کارشناسی مهندسی کامپیوتر گرایش نرم افزار ، از دانشگاه صنعتی شاهرود (1394-1390)
معدل : 15.85
عنوان پروژه : طراحی سایت فروشگاه دیجیتالی با استفاده از وردپرس
3- دیپلم :
دیپلم ریاضی ، از دبیرستان تیزهوشان علامه حلی تهران-اندیشه (1389-1385)
سابقهی پژوهشی:
مقاله با عنوان "مقایسه و ارزیابی شبکههای عصبی بازگشتی RBM و LSTM برای برچسبزنی تصاویر" در کنفرانس CFIS2019
مهارتها :
برنامه نویسی C و C++ و java و python
مسلط به نرمافزار متلب
به اطلاع متقاضیان دکترای سال تحصیلی 1404-1403 رشته های مهندسی (مکانیک - کامپیوتر - برق - مواد - عمران - صنایع) دانشگاه بوعلی سینا می رساند، فهرست اساتید پذیرنده دانشکده مهندسی...
به اطلاع می رساند یک شرکت دانش بنیان در اصفهان نیازمند خدمات تحقیقاتی دانش آموختگان رشته های مواد و شیمی بوده و استخدام می کند. علاقمندان جهت کسب اطلاعات بیشتر و هماهنگی با شماره 03133879868 در...
به گزارش بسنا، مراسم افتتاحیه این پروژه با حضور محمدعلی زلفیگل وزیر علوم، تحقیقات و فناوری و دکتر علیرضا قاسمیفرزاد استاندار همدان، معاونان وزارتخانههای علوم و مسئولان استانی و ریاست...
دفتر هدایت استعدادهای درخشان دانشگاه بوعلیسینا فهرست اسامی دانشجویان برگزیده آموزشی پژوهشی پانزدهمین همایش سالانه دفتر هدایت استعدادهای درخشان سال ۱۴۰۲ را منتشر کرد. اسامی دانشجویان...
بهراد توتونچی دبیر انجمن علمی دانشجویی مهندسی عمران دانشگاه بوعلی سینا، در جلسه ای با حضور نمایندگان دانشگاه های سراسر کشور، با کسب اکثریت آرا انتخابات، به عنوان دبیر...
در هشتمین نشست از دوره یازدهم هیأت ممیزه دانشگاه بوعلیسینا، آقای دکتر علیرضا حاتمی دارای مدرک دکتری در رشته مهندسی برق با ر أ ی اعضاء از مرتبه...
بدینوسیله انتخاب آقای دکتر آرش فتاح الحسینی را به عنوان پژوهشگر برگزیده دانشگاه در گروه فنی و مهندسی به ایشان و خانواده علمی دانشکده مهندسی تبریک عرض نموده و از خداوند متعال...
بدینوسیله انتخاب دو تن از دانشجویان دانشکده مهندسی مهندس راضیه چهارمحالی در مقطع دکتری رشته مهندسی مواد شاخه خوردگی و مهندسی سطح و مهندس امین نظری در مقطع...
بدینوسیله انتخاب سه عضو هیات علمی دانشکده مهندسی جناب آقایان دکتر جواد بهنامیان ، دکتر حسن علم خواه و دکتر محسن گودرزی در...
براساس اطلاعات پایگاه شاخصهای اساسی علم (ESI)، حضوردکتر محمد حسن مرادی از گروه مهندسی برق دانشکده مهندسی در زمره پژوهشگران پراستناد یک درصد برتر دنیا استمرار پیدا کرد. ...
بدینوسیله انتخاب اعضا محترم هیات علمی سرکار خانم دکتر سموئی (گروه مهندسی صنایع)، جناب آقایان دکتر بابائی (گروه مهندسی عمران)، دکتر حاتمی (گروه مهندسی برق)، دکتر ختن لو (گروه مهندسی...
بدینوسیله انتخاب چهار عضو هیات علمی دانشکده مهندسی جناب آقای دکتر جواد بهنامیان از گروه مهندسی صنایع به عنوان پژوهشگر اول برگزیده، جناب آقای دکتر حسن علم خواه از گروه...
به گزارش بسنا و به نقل از سازمان سنجش، آزمون مرحله نهایی بیست و هشتمین دوره المپیاد علمی دانشجویی کشور با حضور نفرات برگزیده آزمون کارشناسی ارشد (متمرکز) و آزمون غیرمتمرکز المپیاد در دانشگاههای...
به اطلاع دانشجویان محترم می رساند سایت کامپیوتر کارشناسی دانشکده مهندسی به دلیل انجام ثبت نام دانشجویان کارشناسی ورودی 1402 از شنبه 1402/7/22 به مدت یک هفته تعطیل می باشد.
به گزارش بسنا و به نقل از معاونت علمی فناوری ریاست جمهوری، در هشتمین دوره تجلیل از سرآمدان علمی کشور در سال ۱۴۰۲ که با حضور معاون علمی و فناوری و اقتصاد دانشبنیان رئیسجمهور و وزیر علوم...
به اطلاع دانشجویان ورودی جدید تحصیلات تکمیلی (ارشد و دکترا) می رساند، یکشنبه 23 مهر ساعت 11 الی 13 در محل آمفی تئاتر دانشکده مهندسی جلسه معارفه با هیات رییسه دانشکده برگزار می شود. ...
بر اساس اطلاعات جدید نمایه استنادی معتبر scopus ۲۰۲۳، با بررسی مقالات مربوط به ۲۰۲۲، 4 عضو هیات علمی و 1 دانش آموخته دانشکده مهندسی و با بررسی کل مقالات مربوط به سال های مختلف، 1 نفر از اعضای هیات...
نظر به مراتب تعهد، تخصص و تجارب ارزشمند جناب آقای دکتر حسن علم خواه و بنا به پیشنهاد رئیس دانشکده مهندسی، به موجب ابلاغی ایشان با حفظ سمت آموزشی به مدت 2 سال به عنوان...
در حکمی از طرف ریاست دانشگاه آقای دکتر امیرسامان خیرخواه به عنوان مدیر گروه رشته مهندسی صنایع منصوب گردید. در این حکم آمده است : « با احترام و آرزوی توفیق الهی، نظر به مراتب تعهد و تجارب...
در حکمی از طرف ریاست دانشگاه آقای دکتر صالح رازینی به عنوان مدیر گروه رشته مهندسی برق منصوب گردید. در این حکم آمده است : « با احترام و آرزوی توفیق الهی، نظر به مراتب تعهد و تجارب ارزنده...