بهسازی سیگنال گفتار در حوزه زمان فرکانس
نوع فایل: word (قابل ویرایش)
تعداد صفحات : 118 صفحه
چکیده
يکي از موضوعات مهم پردازش سيگنال) به عنوان مثال در سيستمهاي ارتباطي، كدينگ سيگنالهاي صوتي، تشخيص صوت (…، کاهش و حذف نويز ناخواسته از سيگنال اصلي و بهبود آن است. به همین منظور در دهه های گذشته تحقیقات گسترده ای برای بهسازی گفتار انجام شده است. بهسازي گفتار بسته به مساله، هدف آن، ويژگي هاي نويز و امکانات موجود، قابل بررسي است. از اين رو، روش هاي متفاوتي برای طبقه بندی سیستم های بهسازی گفتار وجود دارد، یکی از طرق تفکیک روش¬ها بر اساس تککاناله و چندکاناله بودن می باشد. روش های یک کاناله که تنها یک میکروفون ورودی در دسترس دارند، متداولترين نوع الگوريتمهاي بلادرنگ ميباشند چرا که به سادگي قابل پيادهسازي هستند و به طور نسبي هزينه آنها کمتر از سيستمهايي با چند کانال ورودي ميباشد. از خانواده ی روش های تک کاناله، میتوان به روش های تفریق طیفی ، فیلتر وینر، بهسازی گفتار با استفاده از مدل های آماری، تبدیل موجک و … اشاره کرد که هر کدام از این روش ها دارای معایب نظیر نویز موزیکال و اعوجاج و پیچیدگی … می باشند یکی از روش هایی که میتوان عیب این روش ها را بهبود بخشید، استفاده از سیستم های ترکیبی است که از ترکیب روش ها حاصل می شود. در اینجا دو روش ترکیبی جدید بر مبنای روش تک کاناله برای بهسازی گفتار پیشنهاد شده است. در ضمن عموما برای اندازه گیری مشخصات نویز از بخش های غیر گفتار (سکوت) که معمولا از پنجره اول سیگنال است، استفاده می شود. ضعف شدید این روش هنگامي آشكار ميشود كه فريم اول، يك فريم سكوت نباشد. روش جدیدی نیز برای بر طرف کردن این عیب پیشنهاد شده است که این روش ها به شرح زیر می باشند: الف)روش پیشنهادی تخمین نویز: تخمین نویز با استفاده از آنالیز LPC صورت گرفته است و در هر دو روش پیشنهادی زیر از این روش برای تخمین نویز استفاده شده است. ب) روش پیشنهادی اول: بهسازی سیگنال های صوتی با استفاده از الگوریتم ژنتیک و آنالیز LPC در روش تفریق موجک، از ترکیب روش های تفریق طیفی و تبدیل موجک حاصل شده و تخمین نویز آن هم که توسط آنالیز LPC صورت گرفته است با الگوریتم ژنتیک بهبود یافته است. پ) روش پیشنهادی دوم: بهسازی سیگنال های صوتی با استفاده از روش میانگین خطای مربعات در فضای موجک، از ترکیب دو روش تبدیل موجک و كمينه كردن لگاریتم خطاي ميانگين مربعات(LOG-MMSE) حاصل شده است. در این روش با استفاده از تبدیل فوریه ضرایب موجک سیگنال گفتار آغشته به نویز و سیگنال نویز، تخمین زننده ی لگاریتمی بر مبنای کمترین خطای میانگین مربعات پیشنهاد شده است. در این رساله معیار ارزیابی ، معیارهای مهم نسبت سیگنال به نویز(SNR) و تست شنوایی(MOS) بوده است. با توجه به نتایج، این روش ها هم از لحاظ کیفی و هم از لحاظ کمی عملکرد بهتری داشته اند و توانسته اند SNR و MOS و اعوجاج و نویز موزیکال را بهبود ببخشند. کليد واژه: بهسازي سیگنال صوتی، ،تفریق طیفی تبدیل موجك، تخمین زننده log MMSE، آناليز LPC ، الگوریتم ژنتیک
فهرست مطالب
فصل اول: 1
مقـــــدمه 1
۱-۱ پیشگفتار 1
۱-۲ بهسازی گفتار نویزی:اهداف،کاربردها،مفاهیم 2
۱-۳ تعریف مسئله و تقسیم بندی روش ها 3
۱-۴ نوآوری تحقیق 4
۱-۵ ساختار 4
فصل دوم 5
پیش زمینه های پردازش سیگنال گفتار 5
۲-۱ نحوه توليد گفتار در انسان 5
۲-۲ معرفی نويز و انواع آن 10
۲-۲-۱ نويز سفيد 13
۲-۲-۲ نويز صورتي 13
۲-۲-۳ نويز قهوهاي 14
۲-۲-۴ نويز صنعتي 14
۲-۳ تحلیل زمان- فرکانسی سیگنال گفتار 15
۲-۳-۱ تبدیل فوریه 15
۲-۳-۲ تبديل فوريه زمان-كوتاه 17
۲-۳-۳ آناليز چند دقت زمان فرکانسی 20
۲-۳-۴ تبديل موجک يك بعدي 20
۲-۳-۴-۱ تبديل موجک پيوسته 20
۲-۳-۴-۱-۱ دقت های زمانی و فركانسی 22
۲-۳-۴-۱-۲ روابط رياضي تبديل موجک: 22
۲-۳-۴-۱-۳ عكس تبديل موجک: 24
۲-۳-۴-۲ تبدیل موجک گسسته 24
۲-۴ الگوریتم بهینه سازی ژنتیک 28
۲-۴-۱ درباره علم ژنتیک 28
۲-۴-۲ تاریخچۀ علم ژنتیک 29
۲-۴-۳ تکامل طبیعی (قانون انتخاب طبیعی داروین)و رابطه آن با روش های هوش مصنوعی 29
۲-۴-۴ الگوریتم ژنتیک 32
۲-۴-۵ مكانيزم الگوريتم ژنتيك 34
۲-۴-۶ عملگرههاي الگوريتم ژنتيك 37
۲-۴-۶-۱ کدگذاری 37
۲-۴-۶-۲ ارزیابی 37
۲-۴-۶-۳ ترکیب 37
۲-۴-۶-۴ جهش 37
۲-۴-۶-۵ رمزگشايي 38
۲-۴-۷ چارت الگوريتم به همراه شبه كد آن 38
۲-۴-۷-۱ شبه كد و توضيح آن 38
۲-۴-۷-۲ چارت الگوریتم ژنتیک 40
۲-۴-۸ تابع هدف 41
۲-۴-۹ روشهای کد کردن 41
۲-۴-۹-۱ کدینگ باینری 42
۲-۴-۹-۲ کدینگ جایگشتی 42
۲-۴-۹-۳ کد گذاری مقدار 43
۲-۴-۹-۴ کدینگ درخت 44
۲-۴-۱۰ نمایش رشتهها 45
۲-۴-۱۱ جمعيت 46
۲-۴-۱۱-۱ ايجادجمعيت اوليه 46
۲-۴-۱۱-۲ اندازه جمعيت 46
۲-۴-۱۲ محاسبه برازندگي (تابع ارزش) 47
۲-۴-۱۳ انواع روشهای انتخاب 48
۲-۴-۱۳-۱ انتخاب چرخ رولت 49
۲-۴-۱۳-۲ انتخاب حالت پایدار 51
۲-۴-۱۳-۳ انتخاب نخبه گرایی 51
۲-۴-۱۳-۴ انتخاب رقابتی 51
۲-۴-۱۳-۵ انتخاب قطع سر 52
۲-۴-۱۳-۶ انتخاب قطعی بریندل 52
۲-۴-۱۳-۷ انتخاب جایگزینی نسلی اصلاح شده 53
۲-۴-۱۳-۸ انتخاب مسابقه 53
۲-۴-۱۳-۹ انتخاب مسابقه تصادفی 53
۲-۴-۱۴ انواع روشهای ترکیب 53
۲-۴-۱۴-۱ جابهجایی دودوئی 54
۲-۴-۱۴-۲ جابهجایي حقيقي 56
۲-۴-۱۴-۳ ترکیب تکنقطهای 57
۲-۴-۱۴-۴ ترکیب دو نقطهای 58
۲-۴-۱۴-۵ ترکیب n نقطهای 58
۲-۴-۱۴-۶ ترکیب یکنواخت 58
۲-۴-۱۴-۷ ترکیب حسابی 59
۲-۴-۱۴-۸ ترتیب 59
۲-۴-۱۴-۹ چرخه 60
۲-۴-۱۵ احتمال تركيب 60
۲-۴-۱۶ تحليل مكانيزم جابجایي 61
۲-۴-۱۷ جهش 61
۲-۴-۱۷-۱ جهش باينري 63
۲-۴-۱۷-۲ جهش حقيقي 64
۲-۴-۱۷-۳ وارونه سازی بیت 64
۲-۴-۱۷-۴ تغییر ترتیب قرارگیری 64
۲-۴-۱۷-۵ وارون سازی 64
۲-۴-۱۷-۶ تغییر مقدار 65
۲-۴-۱۸ محک اختتام اجرای الگوریتم ژنتیک 65
۲-۴-۱۹ نقاط قوّت الگوریتمهای ژنتیک 66
۲-۴-۲۰ محدودیتهای GAها 68
۲-۵ آنالیز ضرایب پیشگویی خطی (LPC) 69
۲-۵-۱ محاسبه ضرایب LPC 70
فصل سوم 73
مروری برروش های عمده بهسازی گفتار 73
۳-۱ مقدمه 73
۳-۲ روش تفریق طیفی 74
۳-۳ روش فیلتر وینر 76
۳-۴ بهسازی گفتار با استفاده از مدل های آماری 78
۳-۴-۱ تخمین زننده لگاریتمی بر مبنای كمينه كردن خطاي ميانگين مربعات(Log MMSE) 78
۳-۴-۲ استفاده از مدل مخفی مارکف(HMM) برای بهسازی گفتار 80
۳-۵ روش زیر فضای سیگنال 82
۳-۶ بهسازی گفتار با استفاده از تبدیل موجک 83
۳-۷ مقایسه روش ها و بررسی نقاط قوت و ضعف 85
۳-۷-۱ بررسی های مقایسه ای انجام شده بین برخی از روش های بهینه سازی گفتار 86
۲-۳-۲ چکیده ای ازویژگی ها ونقاط قوت و ضعف روش های مختلف 87
۳-۸ نکات و ملاحظاتی مهم درطراحی سیستم بهسازی گفتار 89
۳-۸-۱ استفاده از سیستم های ترکیبی 89
۳-۸-۲ استفاده از پردازش های زیر باند و مزایای آن 89
۳-۸-۳ استفاده از میکروفون دوم 90
فصل چهارم : روش های پیشنهادی 92
۴-۱ مقدمه 92
۴-۲ روش های پیشنهادی 93
۴-۲-۱ بهسازی سیگنال های صوتی با استفاده از الگوریتم ژنتیک و آنالیز LPC در روش تفریق موجک 93
۴-۲-۱-۱ روش تفریق طیفی ضرایب موجک (WSS) 94
۴-۲-۱-۲ اصلاح روش تفريق طيفي ضرايب موجك (IWSS) 95
۴-۲-۱-۳ تخمين نويز 96
۴-۲-۱-۴ الگوریتم ژنتیک 97
۴-۲-۱-۴-۱ عملگر انتخاب 97
۴-۲-۱-۴-۲ عملگر برش 98
۴-۲-۱-۴-۳ عملگر جهش 98
۴-۲-۱-۴-۴ جمعيت اوليه 98
۴-۲-۱-۴-۵ تابع هدف 98
۴-۲-۲ بهسازی سیگنال های صوتی با استفاده از روش میانگین خطای مربعات در فضای موجک 98
۴-۲-۲-۱ تخمین زننده Log MMSE در فضای موجک 99
۴-۲-۲-۲ تخمین نویز 100
فصل پنجم: نتایج و آزمایش ها 101
۵-۱ مقدمه 101
۵-۲ جزئیات پیاده سازی 102
۵-۳ نتایج بهسازی سیگنال های صوتی با استفاده از الگوریتم ژنتیک و آنالیز LPC در روش تفریق موجک 103
۵-۴ نتایج بهسازی سیگنال های صوتی با استفاده از روش میانگین خطای مربعات در فضای موجک 106
فصل ششم: نتیجه گیری و پیشنهادها 109
۶-۱ نتیجه گیری 109
۶-۲ پیشنهاد برای کارهای آتی 111
مراجع 112