به طور کلی امروزه سیستم های شناسایی اجزاء جمله به دلیل کاربردهای فراوانی که دارند، بسیار مورد توجه قرار گرفته اند و تعداد زیادی از محققین در این زمینه مشغول به فعالیت می باشند. از جمله این کاربردها می توان کمک به نابینایان، کمک به ناشنوایان، سیستمهای شناسایی اشخاص، آموزش زبان و… را اشاره نمود. حال ممکن است این سئوال مطرح شود که چرا هدف ما در این پروژه شناسایی واکه هاست. در پاسخ به این پرسش باید گفت که از نظر انرژی و دامنه بخش اعظم یک هجا را واکه ها تشکیل داده اند، بنابراین شناسایی واکه ها مهمترین مرحله شناسایی اجزاء جمله می باشد و حصول به این مقصود، راه را بسیار هموار می سازد.
این پایان نامه بر روی آشکارسازی محل واکه ها تاکید دارد و روشی برای قطعه بندی سیگنال ورودی بر اساس تعیین محل رخدادها ارائه میکند. برای تعیین مرز این رویدادها از سه روش تعیین کردن تغییرات وابستگی طیفی سیگنال در دوره های کوتاه زمانی، تغییرات مشخصات آکوستیکی و تغییرات دامنه و فرکانس فرمنتها بطور همزمان استفاده شده است و تمامی مکانهای تعیین شده توسط هر یک، مبین وقوع یک رویداد میباشد سپس برای هر قطعه نرخ عبور از صفر، نسبت مجموع ضرایب فوریه برای هر بانک ایجاد شده در طیف فوریه و نسبت انرژی هر قطعه به قطعه قبل و بعد آن قطعه را بدست می آوریم و با اعمال آنها به شبکه عصبی FUZZY ARTmap مرز واکه ها تعیین می گردد.
مقدمه:
از قدیم که انسان زبانهایی را برای گفتار اختراع کرد گفتار مستقیم ترین راه برای انسان برای رساندن اطلاعات به دیگری بوده است. تاکنون ارتباط با استفاده از گفتار معمول ترین روش در شبکه های ارتباطی بوده است. سیگنال گفتار هم اکنون در بین تکنولوژی های واسط همانند تلفن، فیلم رادیو، تلویزیون و اینترنت گسترش یافته است. از اینرو نوشته های بسیاری در زمینه پردازش سیگنال گفتار پیشنهاد شده است و الگوریتمهای زیادی مربوط به آنها ارائه شده است. بهرحال با توجه به طبیعت متغیر با زمان سیستم تولید گفتار انسان، صحت و توانایی سیستم همچنان به عنوان مشکلی در زمینه پردازش سیگنال گفتار باقی مانده است. با توجه به کاربردهای فراوان قطعه بندی گفتار و تعیین محل واکه و همخوان، روشهای گونانی برای این منظور ارائه شده است. هدف از این تحقیق ارائه روشی با استفاده از نتایج و تجربیات صورت گرفته در تحقیقات گذشته برای معرفی مدلی با دقت و سرعت بالا در تعیین محل واکه ها میباشد.
در فصل اول کلیاتی راجع به این هدف مشاهده میکنید، در فصل دوم با مفاهیم اولیه این بحث آشنایی پیدا میکنیم سپس در فصل سوم شبکه عصبی و روابط آن مورد بررسی قرار میگیرد، در فصل چهارم در مورد مراحل کار توضیح داده میشود و در نهایت در فصل پنجم نتایج بدست آمده مورد بررسی قرار می گیرد.
فصل اول: کلیات
1-1) هدف
از زمان اختراع تلفن توسط الکساندر گراهام بل در سال 1875 با پردازش سیگنال گفتار به عنوان یک هدف مهندسی رفتار شده است که به علت تکنیکهای اطلاعاتی توسعه زیادی یافته است. بخصوص توسعه سریع مدارات VLSI و کامپیوترهای شخصی باعث پشرفت چشمگیر پردازش سیگنال شده است. بطورکلی تحقیقات در حوزه پردازش سیگنال گفتار به 6 دسته تقسیم می شود.
1- انتقال و ذخیره گفتار
2- سیستم های تولید گفتار
3- شناسایی و تشخیص گوینده
4- سیستم های بازشناسی گفتار
5- خدمات به معلولان
6- بهبود و ارتقاء کیفیت سیگنال گفتار
2-1) پیشینه تحقیق
کارهای بسیاری بر روی پردازش سیگنال گفتار انجام شده است اما درستی و توانایی سیستم پردازش سیگنال گفتار همچنان دارای مشکلاتی است. اصلی ترین دلیل این مشکل آن است که سیستم تولید گفتار انسان متغیر با زمان است و سیگنال طبیعی یک فرآیند متغیر است.
3-1) روش کار و تحقیق
در این تحقیق سعی بر آن داریم تا روشی را برای تعیین محل و نوع واکه ها ارائه دهیم. با استفاده از روش توضیح داده شده در فصل دوم سیگنالهای ورودی گفتار را به کمک تعیین محل رخدادها قطعه بندی کرده و سپس برای هر قطعه نرخ عبور از صفر، نسبت مجموع ضرایب فوریه برای هر بانک ایجاد شده در طیف فوریه و نسبت انرژی هر قطعه به قطعه قبل و بعد آن قطعه را بعنوان ورودی به شبکه عصبی اعمال می نماییم.
تعداد صفحه : 82
فهرست مطالب:
چکیده 1
مقدمه 2
فصل اول: کلیات 3
1-1 ) هدف 4
2-1 ) پیشینه تحقیق 4
3-1 ) روش کار و تحقیق 4
4-1 ) دستگاه گویش انسان ومدل تولید گفتار 5
5-1 ) آواهای زبان فارسی 8
1-5-1 ) آواهای واکدار و آواهای بیواک 9
2-5-1 ) همخوان و واکه 9
3-5-1 ) واج و واجگونه 11
4-5-1 ) هجا در زبان فارسی 11
6-1 ) مشخصه های نوای گفتاری 12
1-6-1 ) زیر و بمی 12
2-6-1 )کشش 13
3-6-1 ) شدت 13
فصل دوم : تقطیع سیگنال گفتار در سطوح مختلف جمله 14
1) مقدمه 15 -2
2) تشخیص قطعات سکوت، واکدار و بیواک 15 -2
3) تعیین فرکانس فرمنت و گام 20 -2
4) قطعه بندی رویدادها 22 -2
1-4 ) قطعه بندی بر اساس تغییرات وابستگی طیفی 23 -2
2) قطعه بندی بر اساس تغییرات آکوستیکی 24 -4-2
3) قطعه بندی بر اساس تغییرات دامنه و فرکانس فرمنت ها 34 -4 -2
5) تعیین مرزهای اصوات انفجاری غیر واکدار 35 –2
فصل سوم: شبکه عصبی 37
1-3 ) مقدمه 38
2-3 ) ساختار مغز انسان 38
3-3 ) شبکه عصبی چیست؟ 39
4-3 ) نحوه یادگیری در مغز 40
5-3 ) معرفی مدل ریاضی نرون ساده خطی 40
6-3 ) انواع شبکه های عصبی مصنوعی از نظر برگشت پذیری 43
1-6-3 ) شبکه های پیش خور 43
2-6-3 ) شبکه های پسخور برگشتی 44
7-3 ) یادگیری در نرون 45
1-7-3 ) یادگیری نظارت شده 45
2-7-3 ) یادگیری نظارت نشده 45
3-7-3 ) یادگیری تقویتی 46
8-3 ) شبکه های پرسپترون چند لایه 46
9-3 ) گره ها و لایه های مورد نیاز 48
10-3 ) پس انتشار 48
50 ART 11-3 ) شبکه عصبی
54 Fuzzy ARTmap 12-3 ) شبکه عصبی
فصل چهارم: پیاده سازی روش 58
1-4 ) مقدمه 59
2-4 ) بررسی روش های ارائه شده 59
3-4 ) روش کار 60
فصل پنجم: نتیجه گیری و پیشنهادات 63
نتیجه گیری 64
پیشنهادات 65
منابع و ماخذ
فهرست منابع فارسی 66
فهرست منابع لاتین 67
چکیده انگلیسی 70
دانلود پایان نامه تعیین محدوده واکه ها در سیگنال گفتار پیوسته