بازشناسی گفتار

 | تاریخ ارسال: 1399/7/1 | 
 دانشکده مهندسی پزشکی       
 
تحصیلات تکمیلی   (اختیاری)
 
 
عنوان درس: بازشناسی گفتار
 
تعداد واحد       ۳                                                 پیش نیاز  -
                                                                                      
 
                                                                           هم نیاز   -
        
 

اهداف کلی درس رئوس مطالب:
 
1. سیستم تولید و درک گفتار انسان و مقدماتی در آواشناسی گفتار
 
2. روش های مرسوم تجزیه و تحلیل و بازنمایی سیگنال گفتار
تبدیل فوریه زمان کوتاه 
بازنمایی"MFCC", "PLP", "LPC"  
روش های مختلف نرمالیزاسیون بازنمایی گفتار
 
3. روش های جدید در فراهم نمودن بازنمایی های مناسب جهت بازشناسی گفتار
تبدیل ویولت ویژگی های آشوب گونه سیگنال گفتار 
بازنمایی اصلاح شده مبتنی بر ویژگی  "MFCC"
نگاشت بازنمایی سیگنال گفتار به فضاهای دیگر جهت جداسازی بهتر آن ها 
روش های"PCA" خطی و غیرخطی در جهت فشرده سازی بازنمایی سیگنال گفتار
 
4. کلیات سیستم های بازشناسی گفتار و انواع آن بر حسب نوع و محیط کاربرد
 
5. سیستم بازشناسی گفتار مبتنی بر روش جابجایی زمان پویا "DTW"
 
6. سیستم بازشناسی گفتار مبتنی بر مدل مخفی مارکف ،"HMM" مدل سازی زیر لغوی، مدل سازی وابسته به متن (دایفون و ترایفون)
 
7. سیستم بازشناسی گفتار مبتنی بر شبکه های عصبی

8.مقاوم سازی سیستم های بازشناسی گفتار مبتنی بر مدل مخفی مارکف
مقاوم سازی به نویز 
مقاوم سازی به تغییر میکروفن 
مقاوم سازی به تغییر گوینده

 9. مقاوم سازی سیستم های بازشناسی گفتار مبتنی بر شبکه های عصبی

 
10. شناسایی گوینده )بازشناسی و تأیید( ، وابسته و غیر وابسته به متن، با استفاده از روش های "GMM", "HMM", "VQ" و شبکه عصبی

11.مدل های زبان طبیعی جهت استفاده در بازشناسی گفتار:
لزوم استفاده از مدل زبانی در سیستم های بازشناسی گفتار 
مدل آماری چندتایی کلمات N- gram  از نوع عادی و نوع دسته بندی شده
مدل های معنایی "PLSA", "LSA"روش ارزیابی:
 
□ عملکردی    □ آزمون نوشتاری    ■ آزمون نهایی    ■ میان ترم    □ ارزشیابی مستمر
* بسته به نظر استاد ممکن است مواردی نظیر تمرینها، سمینار و پروژه در نمره پایانی درس تأثیر داده شود.
 

مراجع
 
1) X. Huang, A. Acero, H. - W. Hon, and R. Foreword By- Reddy, Spoken Language Processing: A Guide to theory, algorithm, and system development: prentice Hall PTR, 2001 .
9) S. Katagiri, Handbook of neural networks for speech processing: Artech House, Inc. ,2000 .
3) J. R. Deller, J. G. Proakis, and J. H. Hansen, Discrete- time processing of speech signsls: IEEE New York, NY, USA: , 2000 .


دفعات مشاهده: 373 بار   |   دفعات چاپ: 38 بار   |   دفعات ارسال به دیگران: 0 بار   |   0 نظر