سورنا فایل

مرجع دانلود فایل ,تحقیق , پروژه , پایان نامه , فایل فلش گوشی

سورنا فایل

مرجع دانلود فایل ,تحقیق , پروژه , پایان نامه , فایل فلش گوشی

طراحی و پیاده سازی سنتز کننده گفتار

اختصاصی از سورنا فایل طراحی و پیاده سازی سنتز کننده گفتار دانلود با لینک مستقیم و پر سرعت .

طراحی و پیاده سازی سنتز کننده گفتار


 طراحی و پیاده سازی سنتز کننده گفتار

 

 

 

چکیده

در این پژوهش، چگونگی طرح و پیاده سازی سنتز کننده گفتار ارائه شده است. در سنتز کننده گفتار ابتدا پردازش زبان طبیعی (NLP) بر روی متن ورودی انجام می گیرد در این قسمت جملات ورودی به فهرستی از کلمات تبدیل می شوند سپس صورت واجی متن به وسیله مبدل حروف به صدا و یا با استفاده از فرهنگ لغت استخراج می شود.

مرحله بعدی مولد نوای گفتار می باشد، در واقع یکی از عوامل اصلی برای به دست آوردن یک گفتار مصنوعی با کیفیت بالا، مولد نوای گفتار است که اعمال آن به سیستم سنتز گفتار نقش بسزایی در تولید گفتار طبیعی در زبان های مختلف دارد. نوا یکی از فاکتورهای اصلی برای به دست آوردن یک گفتار مصنوعی با کیفیت زیاد می باشد. مفهوم نوا، زیر و بم کردن صدا و ریتم گفتار که باعث تلفظ و برداشت مفهوم های مختلفی از گفتار می شود، می باشد.

حال در این مرحله روش سنتز گفتار (سنتز شمرده به شمرده لغات، سنتز فرمنت، سنتز الحاقی)، را باید تعیین کنیم. در دو روش اول پارامترهای مشخصه گفتار در هر بازه زمانی توسط مجموعه ای از قواعد تولید می شوند، اما در روش سوم واحدهای گفتار ذخیره شده طبیعی برای تولید گفتار خروجی در کنارهم قرار می گیرند. در این رویکرد گفتار ذخیره شده طبیعی به صورت تکه تکه در کنار هم قرار می گیرند تا تولید یک گفتار خروجی کنند که یکی از مهم ترین جنبه ها در سنتز الحاقی انتخاب طول واحد صحیح است.

مقدمه

سنتز گفتار یک فناوری است که به وسیله آن متن به گفتار مصنوعی تبدیل می شود. در موضوع سنتز گفتار، ذخیره سازی کلمات یک زبان غیرممکن (و اغلب بی فایده) است. در واقع سنتز گفتار، تولید گفتار از طریق رونویسی حروف به آوا، به منظور گفتن جملات می باشد. در فصل 1 کلیات این پژوهش شامل هدف، تحقیقات انجام شده و نحوه انجام پژوهش بررسی شده است. در فصل 2 توضیحاتی در خصوص سنتز کننده گفتار ارائه شده است. در فصل 3 مدل تولید گفتار بررسی شده است. در فصل 4 به بررسی سنتز گفتار پرداخته شده است. پایان فصل 5 به نتیجه گیری و بیان پیشنهادات ارائه شده است.


دانلود با لینک مستقیم


طراحی و پیاده سازی سنتز کننده گفتار

دانلود پایان نامه تعیین محدوده واکه ها در سیگنال گفتار پیوسته

اختصاصی از سورنا فایل دانلود پایان نامه تعیین محدوده واکه ها در سیگنال گفتار پیوسته دانلود با لینک مستقیم و پر سرعت .

دانلود پایان نامه تعیین محدوده واکه ها در سیگنال گفتار پیوسته


دانلود پایان نامه تعیین محدوده واکه ها در سیگنال گفتار پیوسته

به طور کلی امروزه سیستم های شناسایی اجزاء جمله به دلیل کاربردهای فراوانی که دارند، بسیار مورد توجه قرار گرفته اند و تعداد زیادی از محققین در این زمینه مشغول به فعالیت می باشند. از جمله این کاربردها می توان کمک به نابینایان، کمک به ناشنوایان، سیستمهای شناسایی اشخاص، آموزش زبان و… را اشاره نمود. حال ممکن است این سئوال مطرح شود که چرا هدف ما در این پروژه شناسایی واکه هاست. در پاسخ به این پرسش باید گفت که از نظر انرژی و دامنه بخش اعظم یک هجا را واکه ها تشکیل داده اند، بنابراین شناسایی واکه ها مهمترین مرحله شناسایی اجزاء جمله می باشد و حصول به این مقصود، راه را بسیار هموار می سازد.

این پایان نامه بر روی آشکارسازی محل واکه ها تاکید دارد و روشی برای قطعه بندی سیگنال ورودی بر اساس تعیین محل رخدادها ارائه میکند. برای تعیین مرز این رویدادها از سه روش تعیین کردن تغییرات وابستگی طیفی سیگنال در دوره های کوتاه زمانی، تغییرات مشخصات آکوستیکی و تغییرات دامنه و فرکانس فرمنتها بطور همزمان استفاده شده است و تمامی مکانهای تعیین شده توسط هر یک، مبین وقوع یک رویداد میباشد سپس برای هر قطعه نرخ عبور از صفر، نسبت مجموع ضرایب فوریه برای هر بانک ایجاد شده در طیف فوریه و نسبت انرژی هر قطعه به قطعه قبل و بعد آن قطعه را بدست می آوریم و با اعمال آنها به شبکه عصبی FUZZY ARTmap مرز واکه ها تعیین می گردد.

مقدمه:

از قدیم که انسان زبانهایی را برای گفتار اختراع کرد گفتار مستقیم ترین راه برای انسان برای رساندن اطلاعات به دیگری بوده است. تاکنون ارتباط با استفاده از گفتار معمول ترین روش در شبکه های ارتباطی بوده است. سیگنال گفتار هم اکنون در بین تکنولوژی های واسط همانند تلفن، فیلم رادیو، تلویزیون و اینترنت گسترش یافته است. از اینرو نوشته های بسیاری در زمینه پردازش سیگنال گفتار پیشنهاد شده است و الگوریتمهای زیادی مربوط به آنها ارائه شده است. بهرحال با توجه به طبیعت متغیر با زمان سیستم تولید گفتار انسان، صحت و توانایی سیستم همچنان به عنوان مشکلی در زمینه پردازش سیگنال گفتار باقی مانده است. با توجه به کاربردهای فراوان قطعه بندی گفتار و تعیین محل واکه و همخوان، روشهای گونانی برای این منظور ارائه شده است. هدف از این تحقیق ارائه روشی با استفاده از نتایج و تجربیات صورت گرفته در تحقیقات گذشته برای معرفی مدلی با دقت و سرعت بالا در تعیین محل واکه ها میباشد.

در فصل اول کلیاتی راجع به این هدف مشاهده میکنید، در فصل دوم با مفاهیم اولیه این بحث آشنایی پیدا میکنیم سپس در فصل سوم شبکه عصبی و روابط آن مورد بررسی قرار میگیرد، در فصل چهارم در مورد مراحل کار توضیح داده میشود و در نهایت در فصل پنجم نتایج بدست آمده مورد بررسی قرار می گیرد.

فصل اول: کلیات

1-1) هدف

از زمان اختراع تلفن توسط الکساندر گراهام بل در سال 1875 با پردازش سیگنال گفتار به عنوان یک هدف مهندسی رفتار شده است که به علت تکنیکهای اطلاعاتی توسعه زیادی یافته است. بخصوص توسعه سریع مدارات VLSI و کامپیوترهای شخصی باعث پشرفت چشمگیر پردازش سیگنال شده است. بطورکلی تحقیقات در حوزه پردازش سیگنال گفتار به 6 دسته تقسیم می شود.

1- انتقال و ذخیره گفتار

2- سیستم های تولید گفتار

3- شناسایی و تشخیص گوینده

4- سیستم های بازشناسی گفتار

5- خدمات به معلولان

6- بهبود و ارتقاء کیفیت سیگنال گفتار

2-1) پیشینه تحقیق

کارهای بسیاری بر روی پردازش سیگنال گفتار انجام شده است اما درستی و توانایی سیستم پردازش سیگنال گفتار همچنان دارای مشکلاتی است. اصلی ترین دلیل این مشکل آن است که سیستم تولید گفتار انسان متغیر با زمان  است و سیگنال طبیعی یک فرآیند متغیر است.

3-1) روش کار و تحقیق

در این تحقیق سعی بر آن داریم تا روشی را برای تعیین محل و نوع واکه ها ارائه دهیم. با استفاده از روش توضیح داده شده در فصل دوم سیگنالهای ورودی گفتار را به کمک تعیین محل رخدادها قطعه بندی کرده و سپس برای هر قطعه نرخ عبور از صفر، نسبت مجموع ضرایب فوریه برای هر بانک ایجاد شده در طیف فوریه و نسبت انرژی هر قطعه به قطعه قبل و بعد آن قطعه را بعنوان ورودی به شبکه عصبی اعمال می نماییم.

تعداد صفحه : 82

 

 

فهرست مطالب:
چکیده 1
مقدمه 2
فصل اول: کلیات 3
1-1 ) هدف 4
2-1 ) پیشینه تحقیق 4
3-1 ) روش کار و تحقیق 4
4-1 ) دستگاه گویش انسان ومدل تولید گفتار 5
5-1 ) آواهای زبان فارسی 8
1-5-1 ) آواهای واکدار و آواهای بیواک 9
2-5-1 ) همخوان و واکه 9
3-5-1 ) واج و واجگونه 11
4-5-1 ) هجا در زبان فارسی 11
6-1 ) مشخصه های نوای گفتاری 12
1-6-1 ) زیر و بمی 12
2-6-1 )کشش 13
3-6-1 ) شدت 13
فصل دوم : تقطیع سیگنال گفتار در سطوح مختلف جمله 14
1) مقدمه 15 -2
2) تشخیص قطعات سکوت، واکدار و بیواک 15 -2
3) تعیین فرکانس فرمنت و گام 20 -2
4) قطعه بندی رویدادها 22 -2
1-4 ) قطعه بندی بر اساس تغییرات وابستگی طیفی 23 -2
2) قطعه بندی بر اساس تغییرات آکوستیکی 24 -4-2
3) قطعه بندی بر اساس تغییرات دامنه و فرکانس فرمنت ها 34 -4 -2
5) تعیین مرزهای اصوات انفجاری غیر واکدار 35 –2
فصل سوم: شبکه عصبی 37
1-3 ) مقدمه 38
2-3 ) ساختار مغز انسان 38
3-3 ) شبکه عصبی چیست؟ 39
4-3 ) نحوه یادگیری در مغز 40
5-3 ) معرفی مدل ریاضی نرون ساده خطی 40
6-3 ) انواع شبکه های عصبی مصنوعی از نظر برگشت پذیری 43
1-6-3 ) شبکه های پیش خور 43
2-6-3 ) شبکه های پسخور برگشتی 44
7-3 ) یادگیری در نرون 45
1-7-3 ) یادگیری نظارت شده 45
2-7-3 ) یادگیری نظارت نشده 45
3-7-3 ) یادگیری تقویتی 46
8-3 ) شبکه های پرسپترون چند لایه 46
9-3 ) گره ها و لایه های مورد نیاز 48
10-3 ) پس انتشار 48
50 ART 11-3 ) شبکه عصبی
54 Fuzzy ARTmap 12-3 ) شبکه عصبی
فصل چهارم: پیاده سازی روش 58
1-4 ) مقدمه 59
2-4 ) بررسی روش های ارائه شده 59
3-4 ) روش کار 60
فصل پنجم: نتیجه گیری و پیشنهادات 63
نتیجه گیری 64
پیشنهادات 65

منابع و ماخذ
فهرست منابع فارسی 66
فهرست منابع لاتین 67
چکیده انگلیسی 70


دانلود با لینک مستقیم


دانلود پایان نامه صحت گفتار

اختصاصی از سورنا فایل دانلود پایان نامه صحت گفتار دانلود با لینک مستقیم و پر سرعت .

دانلود پایان نامه صحت گفتار


دانلود پایان نامه صحت گفتار

برای برقراری ارتباط کامپیوتر با انسان بوسیلة گفتار در کار لازم است انجام شود. یکی سنتزل گفتار است. و دیگری بازشناسی گفتار، سنتز گفتار بیان گفتار بوسیلة کامپیوتر می‌باشد و بازشناسی یعنی فهمیدن گفتار در بازشناسی گفتار. هدف بدست آوردن دنبالة آوایی یک گفتار می‌باشد و این دنبالة آوایی می‌تواند بر اساس واج، سیلاب، کلمه، جمله و ... باشد. بازشناسی گفتار عکس عمل سنتز است و گفتار را به متن تبدیل می‌کند. اما انجام بازشناسی گفتار به دلیل خاصیت صدای انسانها، دارای پیچیدگی‌های زیادی است. اما اغلب بازشناسی کامل و درست غیر ممکن است. حتی خود انسانها هم نمی‌توانند به طور کامل همه صداها را بفهمند و میزان، درک گوش انسانها حدود 70% می‌باشد. شکل 1-1 ارتباط گفتاری بین انسانها و کامپیوتر را نشان می‌دهد. به دلیل نقش مهم و کاربردهای فراوانی که بازشناسی گفتار دارد، تحقیقات و مقاله‌های زیادی در این زمینه انجام شده و راه حل‌های متفاوتی پیشنهاد شده است،‌ ولی بازشناسی گفتار کاملاً درست هنوز امکان‌پذیر نمی‌باشد.

بازشناسی گفتار دارای کاربردهای زیادی است. از جمله کاربردهای بازشناسی گفتار، حل مشکل تایپ است، با کمک بازشناسی گفتار می‌توان جمله‌ها را یکی پس از دیگری خواند و کامپیوتر آنها را تایپ کند. یکی دیگر از کاربردهای بازشناسی گفتار، حل مشکل صحبت دو فرد مختلف همزبان است. یکی از مشکلات انسانها ارتباط با افرادی است که با زبانهای متفاوت صحبت می‌کنند. ارتباط بدون دانستن زبان مشکل است. و یادگیری یک زبان دیگر کار وقت گیر و پر زحمتی است ولی به کمک بازشناسی گفتار به یادگیری زبانهای مختلف احتیاجی نخواهد بود و می‌توان با یک دستگاه کوچک با فردی که با زبان دیگری صحبت می‌کند، صحبت نمود. یک کامپیوتر کوچک صدای شما را گرفته و به تعدادی از کلمات تبدیل می‌نماید. سپس این کلمات به زبان دیگر ترجمه شده و در نهایت با زبان جدید گفته می‌شوند. دو مرحلة آخر این سیستم جزو مسایل انجام شده گفتار هستند و با کامل نمودن مسئله بازشناسی گفتار بدون دانستن زبان‌های دیگر به آنها تکلم نمود.

شکل 1-2 نشان دهنده ارتباط دو فرد با زبان‌های مختلف است. یکی از کاربردهای دیگر بازشناسی گفتار، برقراری ارتباط با کامپیوتر است. همان گونه که به انسانهای دیگر دسترس می‌دهید، به کامپیوتر هم می‌توان دستور داد و با آن صحبت کرد. یا حتی می‌توانید از او بخواهید کاری برایتان انجام دهد.

حتی با کمک بازشناسی گفتار می‌توان به انسانهای نابینا و ناشنوا کمک کرد. به طور مثال نابینایان می‌توانند با صحبت کردن و دادن دستور به کامپیوتر با آن کار کنند.

صل اول مقدمه

مدل اعضای صوتی انسان

-2 مدل منبع – فیلتر گفتار

فصل دوم

Speech analysist

مقدمه:

فریم بندی سیگنال صحبت

فیلتر پیش تأکید

جداسازی سیگنال صحبت از روی سیگنال زمینه

پیدا کردن اولین و آخرین فریم واکه‌دار

مرحله 4 پیدا کردن نقطة انتهایی و ابتدایی

پیاده سازی الگوریتم‌ها

استخراج ضرائب کپزرم

محاسبة ضرایب دلتاکپترال

پردازش روی فریم‌های واکه دار:

روش اول: استفاده از autocorrelation

روش دوم: استفاده از ضرائب کپستروم

پیاده سازی الگوریتم‌ها

فرکانس فرمنت

استخراج فرکانس فرمنت از طریق حل ریشه‌های LPC

آنالیز پیشگویی خطی (LPC)

مدل تولید صحبت

روش همبستگی

روش کوواریانس

مقایسه روش‌های همبستگی و کوواریانس

مرتبه پیشگو

کوانتیزاسیون برداری

الگوریتم LBG

فصل سوم: انحراف پویای زمانی (Dynamic time warpping)

مقدمه:

– هم ترازی‌سازی زمانی و نرمالیزاسیون

مروری بر Dynamic programing

محدودیتهای نرمالیزاسیون زمانی

محدودیتهای نقطه انتها

شرایط یکنواختی

محدودیت پیوستگی محلی

محدودیت در مسیر سراسری

وزن دهی شیب منحنی

انحراف زمانی پویا (dynamic – lime warping)

 

فصل چهارم

استفاده از مدلهای مارکف مخفی

در تشخیص گفتار

2-3- مدل مارکف مخفی (HMM) ]21[

مدل کاسه و گلوله

1-2-3- اجزای یک HMM

2-2-3- سه مسئله اساسی در HMM

حل مسئله 1

-1-2-2-3- الگوریتم پیشرو – پسرو

2-2-2-3- حل مسئله 2

3-2-2-3- حل مسئله 3

1-4- الگوریتم بام – ولچ ]21[ و ]11[

-4- مسائل مربوط به پیاده سازی روش ML

الف – مقیاس بندی

ب. دنباله های مشاهده چندتایی

پ. تخمین اولیه پارامترهای HMM

فصل 5: بازشناسی و ارزیابی نحوه بیان کلمات مقطع قرآنی

بازشناسی گفتار بوسیله الگوریتم DTW

تاثیر طول پنجره در کیفیت گفتار جداشده در زمینه

تطابق چندالگویی

روش اول: استفاده در میانگین الگوها:

الگوریتم پیدا کردن کلمة مناسب

فلوچارت مربوط به الگوریتم knn

حذف میانگین ضرایب کپستروم

MEI Scald-MFCC

پیاده سازی

طراحی ساختار مدل مخفی مارکوف

مقدار دهی اولیه Hmm

تخمین بیشترین شباهت

بازشناسی گفتار

بخش دوم لرزیابی نحوة بیان گفتار قرآنی

ارزیابی نحوه بیان گفتار قرآنی بوسیله و تطابق الگو

Log spectral Distance

Weignted cepstral Distance

Cepstral Distance

Distance base on LPC

پیدا کردن منحنی فاصله‌ها

امتیازدهی به گوینده

استفاده از هر ارزیابی نحوة بیان

استفاده از Hmm در ارزیابی نحوة بیان

شامل 141 صفحه فایل word


دانلود با لینک مستقیم