[صفحه اصلی ]   [Archive] [ English ]  
:: صفحه اصلي :: درباره نشريه :: آخرين شماره :: تمام شماره‌ها :: جستجو :: ثبت نام :: ارسال مقاله :: تماس با ما :: ::
:: سال 10، شماره 2 - ( دو فصل‌نامه انجمن مهندسی صوتیات ايران پاییز و زمستان 1401 ) ::
جلد 10 شماره 2 صفحات 20-11 برگشت به فهرست نسخه ها
تأیید هویت گویندۀ مقاوم به شرایط تلفنی با استفاده از شبکۀ عصبی تأخیر زمانی (مقاله پژوهشی)
محمد عسگری*، نرگس اکبری، مهران آقاگلزاده، محمدصادق محرابی کیا
چکیده:   (53 مشاهده)
در این تحقیق الگوی شبکۀ عصبی تأخیر زمانی و بردار- x به منظور مقاوم­سازی در برابر نوفه و صافی کردن (فیلترینگ) بسامدی ناشی از ارتباط تلفنی ارایه گردیده است. از ضرایب کپسترال بسامد مل به عنوان ویژگی صوتی مرتبط با گوینده به عنوان ورودی این الگو استفاده شده است. خروجی شبکۀ عصبی این الگو به‌صورت یک بردار-  xدر نظر گرفته شده است تا بتواند در مرحلۀ تصمیم‌­گیری از آن استفاده شود. در مرحلۀ تصمیم‌­گیری از تحلیل تفکیک خطی احتمالاتی به‌منظور امتیازدهی و مقایسه استفاده شده است. به‌منظور افزایش دقت و کاهش نرخ خطای برابر، داده‌­های آموزشی ترکیبی از دادگان نسبتاً تمیز وُکس‌سِلِب‌1، 2 و دادگان تلفنی کال‌هوم و هم‌چنین دادگان نوفه‌ای و تلفنی به‌دست آمده از روش داده‌افزایی هستند. نتایج حاصل از به‌کارگیری این شیوه برای نرخ خطای برابر در حالت تمیز 3/09 درصد است که نسبت به الگو­های پایه در بدترین حالت در حدود 0/15 درصد (3/24 درصد در کارهای پیشین به‌­دست آمده است) و در بهترین حالت 6/93 درصد (10/2 درصد در کارهای پیشین به­‌دست آمده است) بهبود یافته است. در زمانی که آموزش با دادگان وُکس‌سِلِب‌1، 2 و دادگان کال‌هوم به عنوان تطبیق استفاده شده است، نرخ خطای برابر معادل 4/95 درصد به‌دست آمده است. در بدترین حالت زمانی که فقط دادگان وُکس‌سِلِب1 به تلفنی تبدیل شده، نرخ خطای برابر معادل با 14/34 درصد شده است.
واژه‌های کلیدی: تأیید هویت گوینده، شبکۀ عصبی تأخیر زمانی، بردار- x، ضرایب کپسترال بسامد مل، احتمال تحلیل تفکیک خطی.
متن کامل [PDF 960 kb]   (37 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: آوافیزیک
دریافت: 1400/9/24 | پذیرش: 1401/10/7 | انتشار: 1401/12/28
ارسال پیام به نویسنده مسئول

ارسال نظر درباره این مقاله
نام کاربری یا پست الکترونیک شما:

CAPTCHA


XML   English Abstract   Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Asgari M, Akbari N, Aghagolzade M, Mehrabikia M. Telephone robustness speaker verification using time delay neural network (Research Article). مجله علمی پژوهشی انجمن مهندسی صوتیات ایران 2023; 10 (2) :11-20
URL: http://joasi.ir/article-1-231-fa.html

عسگری محمد، اکبری نرگس، آقاگلزاده مهران، محرابی کیا محمدصادق. تأیید هویت گویندۀ مقاوم به شرایط تلفنی با استفاده از شبکۀ عصبی تأخیر زمانی (مقاله پژوهشی). مجله علمی پژوهشی انجمن مهندسی صوتیات ایران. 1401; 10 (2) :11-20

URL: http://joasi.ir/article-1-231-fa.html



بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.
سال 10، شماره 2 - ( دو فصل‌نامه انجمن مهندسی صوتیات ايران پاییز و زمستان 1401 ) برگشت به فهرست نسخه ها
مجله علمی-پژوهشی انجمن علوم صوتی ایران Journal of Acoustical Society of Iran
Persian site map - English site map - Created in 0.07 seconds with 30 queries by YEKTAWEB 4570