سال 9، شماره 1 - ( دو فصل‌نامه انجمن مهندسی صوتیات ايران بهار و تابستان 1400 )                   جلد 9 شماره 1 صفحات 39-28 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Mirbeygi M, Mahabadi A, Ranjbar A. Classification of noise-robust speech features in the speaker authentication system (Research Article). مجله علمی پژوهشی انجمن علوم صوتی ایران 2021; 9 (1) :28-39
URL: http://joasi.ir/article-1-192-fa.html
میربیگی محدثه، مه آبادی امین اله، رنجبر اکبر. طبقه‌بندی ویژگی های گفتار مقاوم به نوفه در سامانه تعیین هویت گوینده (مقاله پژوهشی). مجله علمی پژوهشی انجمن علوم صوتی ایران. 1400; 9 (1) :28-39

URL: http://joasi.ir/article-1-192-fa.html


چکیده:   (2315 مشاهده)
تشخیص­ خودکار هویت ­گوینده کاربردهای وسیعی در سامانه­ های صنعتی و امنیتی دارد و وابسته به ویژگی علامت گفتار است. کاربرد ماتریس ویژگی در شناسایی بی­ درنگ گوینده بسیار مهم و وجود نوفه محیطی و پردازشی منجر به تغییر مشخصات ویژگی­ ها و تولید خطا در تعیین ­هویت است. افزایش ­دقت در تشخیص هویت به فرایند حذف ­نوفه برای تعیین صحیح ویژگی‌های انرژی، آنتروپی انرژی، نرخ عبور از صفر، مرکز ثقل طیفی، گسترش طیفی، آنتروپی طیفی، شار طیفی، و رل­ آف طیفی از علامت ­گوینده نیاز دارد. در طراحی الگوریتم‌های بی­درنگ و قابل ­اعتماد، فرایندهای مهم استخراج صحیح گفتار، شناسایی میزان­ حساسیت و سنجش میزان ­مقاومت مؤلفه‌های علامت برای حذف نوفه و بهبود کیفیت­ گفتار در بهبود علامت ­به نوفه نقش اساسی دارند. هدف اصلی این مقاله ارایه روش طبقه‌بندی ویژگی­­ های علامت گفتار جهت طراحی الگوریتم ­های بی­ درنگ تعیین­ هویت گوینده و مقاوم ­به نوفه با سنجش میزان مقاومت آن است. روش پیشنهادی حذف ­نوفه از ماسک دودویی با ویژگی­ مقاوم مشخص­ بهره­ می­ برد و نتایج تجربی آزمایش‌ها روی داده­ ها، بهبود علامت ­به نوفه 2 الی 3 دسی ­بل را نشان می‌دهد. ارزیابی ماتریس ویژگی در سامانه تشخیص هویت از ضریب کپسترال بسامد­مل و ضریب­ پیشگویی خطی و ضریب­کپستروم تشکیل­ شده که با روش فاصله­ یابی اقلیدسی در مجموعه ­داده ­های استاندارد ارزیابی شده­ است. روش پیشنهادی با وجود داده ­های نوفه­ای توانسته قدرت تشخیص تعیین هویت ­گوینده را به دقت بالای 80 درصد و سرعت بی­ درنگ افزایش دهد.
 
متن کامل [PDF 867 kb]   (841 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: پردازش علائم صوتی
دریافت: 1399/6/20 | پذیرش: 1400/4/31 | انتشار: 1400/6/20

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.