سال 9، شماره 2 - ( دو فصل‌نامه انجمن مهندسی صوتیات ايران پاییز و زمستان 1400 )                   جلد 9 شماره 2 صفحات 119-111 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Shafieian M, Ghiasvand F. Wind noise reduction in recorded speech using Singular Spectrum Analysis (SSA) dataset and machine learning method (Research Article). مجله انجمن علوم صوتی ایران (مهندسی صوتیات سابق) 2022; 9 (2) :111-119
URL: http://joasi.ir/article-1-227-fa.html
شفیعیان معصومه، قیاسوند فرشاد. کاهش اثر نوفه باد در گفتار ضبط‌شده با بهره‌گیری از مجموعه داده‌های تحلیل طیفی تکین (تطت- اِس‌اِس‌اِی) و شیوه یادگیری ماشین (مقاله پژوهشی). مجله انجمن علوم صوتی ایران (مهندسی صوتیات سابق). 1400; 9 (2) :111-119

URL: http://joasi.ir/article-1-227-fa.html


چکیده:   (1253 مشاهده)
در حالت کلی ضبط صدا در محیط‌های مختلف با چالش‌های متفاوتی روبه‌رو می‌باشد. نوفه باد در فضای باز اغلب باعث افت شدید کیفیت علامت گفتار می‌شود. بنابراین باید الگوریتم‌هایی برای کاهش نوفه باد به‌کار برد. به دلیل ماهیت ناایستا و پهن‌باند بودن نوفه باد، صافی کردن (فیلتر کردن) و حذف کردن آن بسیار مشکل است. تحلیل طیفی تکین (اِس‌اِس‌اِی) یک روش قدرتمند تخمین طیفی است که از آن در کاربردهایی از جمله کاهش نوفه، پیش‌بینی سری زمانی و غیره استفاده می‌شود. الگوریتم اِس‌اِس‌اِی علامت‌ها را به فضاهای مقدار ویژه تجزیه می‌کند، مولفه‌های اصلی را براساس سهم آن‌ها انتخاب و دسته‌بندی می‌کند و سرانجام مولفه‌های مطلوب را ساخته و به حوزه زمان برمی‌گرداند. در این پژوهش از روش اِس‌اِس‌اِی و الگوریتم کِی- مینز و صافی بول به شکل ترکیبی و به‌منظور کاهش نوفه باد در علامت‌های گفتار استفاده ‌شده است. علامت گفتار مورد استفاده‌ در روند پژوهش از دادگان تی‌آی‌اِم‌آی‌تی استخراج‌شده است و نوفه باد استفاده‌شده نیز مربوط به دادگانی است که توسّط دانشگاه فنی آخن ارائه گردیده‌اند. نتایج نشان می‌دهند که روش پیشنهادی قادر است تا مقدار 51 درصد میزان کیفیت علامت گفتار را از لحاظ کیفیت ادراکی بهبود بخشد. روش ارائه‌شده در مقایسه با روش‌های مرسوم از قبیل وزن‌دهی طیفی و تفریق طیفی نتایج بهتری از خود نشان می‌دهند.
متن کامل [PDF 1108 kb]   (407 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: پردازش علائم صوتی
دریافت: 1400/7/4 | پذیرش: 1400/12/26 | انتشار: 1400/12/26

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.