دانلود پایان نامه ارشد مهندسی برق: تشخیص حروف صدا دار از روی تصاویر لب

متن کامل پایان نامه مقطع کارشناسی ارشد رشته  مهندسی برق

با عنوان :  تشخیص حروف صدا دار از روی تصاویر لب

در ادامه مطلب می توانید صفحات ابتدایی این پایان نامه را بخوانید

و در صورت نیاز به متن کامل آن می توانید از لینک پرداخت و دانلود آنی برای خرید این پایان نامه اقدام نمائید.

 دانشگاه آزاد اسلامی
واحد تهران جنوب
دانشكده تحصیلات تكمیلی
“M.Sc” پایان نامه برای دریافت درجه كارشناسی ارشد
مهندسی برق- الكترونیك
عنوان :
تشخیص حروف صدا دار از روی تصاویر لب

برای رعایت حریم خصوصی اسامی استاد راهنما،استاد مشاور و نگارنده درج نمی شود

تکه هایی از متن به عنوان نمونه :

(ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)

 

چكیده
از دیرباز تشخیص و بازشناسی صحبت به عنوان اولین وسیله ارتباطی بین انسان ها از اهمیت بسیاری
برخوردار بوده است. تاكنون تكنیكهای بازشناسی صحبت با استفاده از پردازش صوت با تنوع بسیار و با موفقیت
نسبی بكار گرفته شدهاند. اما وجود نویز در برخی شرایط، عامل اصلی بروز اشتباهات اساسی در تشخیص بوده
است كه در این گونه موارد استفاده از پردازش تصویر و به ویژه بررسی شكل لبها و حركت آنها میتواند ب رای
ارتقاء نتایج مورد استفاده قرار گیرد. فرآیند لبخوانی و به عبارت دیگر تشخیص دیداری گفتار دو مرحله اصلی
قابل بررسی دارد. مرحله اول جداسازی ناحیه دهان و بطور كلی استخراج مشخصه های دیداری و مرحله دوم
دستهبندی و تشخیص كلمات میباشد. در این پروژه برای استخراج مشخصه های دیداری دو روش استفاده
و در روش دوم از روش مبتنی بر تبدیل موجك بهره جسته ایم . در SFCM نمودهایم. در روش اول از الگوریتم
مرحله بعد توسط پارامترهای تعریف شده، یكسری ویژگی مربوط به تصاویر لب را استخراج می نماییم . در آخر
توسط شبكه عصبی به دستهبندی ویژگیها و تشخیص واكهها میپردازیم.

مقدمه
كارایی ضعیف سیستمهای تشخیص صوت و سیستمهای تصدیق گوینده در محیطهای نویزی سبب شد تا
محققان به فكر استفاده از اطلاعات دیداری در این سیستمها باشند به همین دلیل آنالیز تصاویر لب، توجه
زیادی را به خود جلب نمود. اولین گام در آنالیز تصاویر لب، استخراج 1 ناحیه مربوط به لب در تصاویر می باشد .
افزایش علاقه در استخراج این اطلاعات توسط بخشبندی تصاویر لب سبب بوجود آمدن روش های گوناگون و
بهبود عملكرد سیستمهای صوتی – تصویری در تشخیص صوت گردید . بزرگترین مشكل در سیستم ه ای
لبخوانی 2 توصیف كمی لب میباشد. معمولاً روشهای توصیف لب را به دو دسته، یكی روشهای سطح پایین
(روشهای مبتنی بر تصویر) و دیگری روشهای سطح بالا (روشهای مبتنی بر مدل) تقسیم مینمایند . دقت و
مقاوم بودن در این فرآیند، مهمترین كلید برای پردازشهای مراحل بعدی میباشد زیرا هر چه این مرحله با
دقت بیشتری انجام شود و بخشبندی ناحیه لب در تصاویر بهتر صورت گیرد مدل نمودن لب راحت تر خواهد
بود و با سهولت بیشتری میتوان ویژگیهای لب را استخراج نمود. گام بعدی بعد از استخراج ویژگی های لب،
دسته بندی و تشخیص ویژگی ها میباشد. در پروژه جاری ما نیز به بررسی تك تك این مراحل و ارائه راهكار
برای بهبود این مراحل میپردازیم.

فصل اول
مروری بر روش ها

 مقدمه
از دیرباز تشخیص و بازشناسی صحبت به عنوان اولین وسیله ارتباطی بین انسان ها از اهمیت بسیاری
برخوردار بوده است. تاكنون تكنیكهای بازشناسی صحبت با استفاده از پردازش صوت با تنوع بسیار و با موفقیت
نسبی بكار گرفته شدهاند. اما وجود نویز در برخی شرایط عامل اصلی بروز اشتباهات اساسی در تشخیص
بوده است كه در این گونه موارد استفاده از پردازش تصویر و به ویژه بررسی شكل لبها و حركت آنها می تواند
برای ارتقاء نتایج مورد استفاده قرار گیرد. استخراج اطلاعات دیداری از تصاویر لب كمك شایانی به تشخیص
صوت و تصدیق گوینده بویژه در محیطهای نویزی را فراهم آورده است به همین دلیل توجه زیادی را به خود
جلب نموده است در این فصل یك مروركلی بر روی روشهای انجام شده تا به حال صورت خواهیم داد و در
مورد دستهبندیهای موجود برای روشها صحبت خواهیم كرد.

1- مروری بر تحقیقات انجام شده
فرآیند لبخوانی و به عبارت دیگر تشخیص دیداری گفتار دو مرحله اصلی ق اب ل بررسی دارد . مرحله اول
جداسازی ناحیه دهان و بطور كلی استخراج مشخصههای دیداری و مرحله دوم دستهبندی و تشخیص كلمات
میباشد. لذا محققین زیادی نیز در سالهای متمادی و در مراحل مختلف تحقیقات خود به این دو مرحله توجه
داشته و به صورت مستقل و یا همزمان به بررسی در زمینه استخراج مشخصه های دیداری و یا دسته بندی
كلمات پرداختهاند. در این فصل ما به بررسی تحقیقات انجام شده در زمینه لبخوانی میپردازیم.

تعداد صفحات: 132

قیمت : 14700 تومان

***

—-

پشتیبانی سایت :       

****         [email protected]

دیدگاهتان را بنویسید