[صفحه اصلی ]   [Archive] [ English ]  
:: صفحه اصلي :: درباره نشريه :: آخرين شماره :: تمام شماره‌ها :: جستجو :: ثبت نام :: ارسال مقاله :: تماس با ما :: ::
:: سال 8، شماره 2 - ( دو فصل‌نامه انجمن مهندسی صوتیات ايران پاییز و زمستان 1399 ) ::
جلد 8 شماره 2 صفحات 51-59 برگشت به فهرست نسخه ها
بهبود میانگین دقت طبقه‌بندیِ واکه‌هایِ فارسی از روی علامتِ گفتار با استفاده از شبکۀ عصبیِ هم‌گشتال (مقاله پژوهشی)
محمد عسگری، نرگس اکبری
چکیده:   (29 مشاهده)
یکی از روی‌کردهای بازشناسیِ گفتار، الگو کردن گفتار بر مبنای تعدادی واحد آوایی است. با توجه به این‌که مشخصات بسامدی و زمانی واکه‌ها، پایدارتر از سایر واج‌ها هستند، تشخیص واکه‌ها برای تشخیص گفتار مهم است. در این پژوهش، هدف ارائه الگویی با استفاده از روش‌های نوین، نظیر شبکۀ عصبی عمیق برای بهبود دقت تشخیص واکه و افزایش کاربردهای آن است. 30 گوینده (15 زن و 15 مرد)، تمامی حالت‌های ترکیب‌ هم‌خوان‌ها با شش واکۀ فارسی را می‌خوانند. دادگان گفتاری پس از پردازش به قاب‌های حاوی فقط واکه بخش‌بندی شده و اسپکتروگرام آن استخراج می‌شود. اسپکتروگرام به‌دست آمده، به‌عنوان ورودی به شبکۀ عصبی پیچشی با دو لایۀ پنهان داده می‌شود. دادگان 25 گوینده برای آموزش و 5 گوینده برای آزمون به‌کار برده شده‌اند. میانگینِ دقتِ تشخیص شش واکۀ فارسی برای الگوی پیشنهادی 93/17 درصد (میانگین خطای 6/83 درصد) به‌دست آمده است که نسبت به کارهای پیشین که میانگین خطایِ تشخیص واکه 9/7 درصد الی 19/6 درصد (کم‌ترین و بیش‌ترین میانگین خطا در الگو‌های موجود) بوده، 2/87 درصد الی 12/77 درصد بهبود یافته است.
 
واژه‌های کلیدی: تشخیص واکه‌های فارسی، شبکۀ عصبی هم‌گشتال (کانولوشنال)، طبقه‌بندی، دادگان فارسی.
متن کامل [PDF 671 kb]   (11 دریافت)    
نوع مطالعه: كاربردي | موضوع مقاله: پردازش علائم صوتی
دریافت: 1398/11/27 | پذیرش: 1399/12/12 | انتشار: 1399/12/20
ارسال پیام به نویسنده مسئول

ارسال نظر درباره این مقاله
نام کاربری یا پست الکترونیک شما:

CAPTCHA


XML   English Abstract   Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Asgari M, Akbari N. Improving the average precision of Persian vowel classification from speech signal by using convolutional neural network (Research Article). مجله علمی پژوهشی انجمن مهندسی صوتیات ایران. 2021; 8 (2) :51-59
URL: http://joasi.ir/article-1-173-fa.html

عسگری محمد، اکبری نرگس. بهبود میانگین دقت طبقه‌بندیِ واکه‌هایِ فارسی از روی علامتِ گفتار با استفاده از شبکۀ عصبیِ هم‌گشتال (مقاله پژوهشی). مجله علمی پژوهشی انجمن مهندسی صوتیات ایران. 1399; 8 (2) :51-59

URL: http://joasi.ir/article-1-173-fa.html



سال 8، شماره 2 - ( دو فصل‌نامه انجمن مهندسی صوتیات ايران پاییز و زمستان 1399 ) برگشت به فهرست نسخه ها
مجله علمی-پژوهشی انجمن lمهندسی صوتیات ایران Journal of Acoustical Engineering Society of Iran
Persian site map - English site map - Created in 0.05 seconds with 30 queries by YEKTAWEB 4297