از جدیترین تنگناها در تبدیل گفتار، نیاز به تعداد بالایی از جملات گوینده هدف برای آموزش سامانه تبدیل گفتار است. شیوههای تبدیل موازی گفتار نیازمند حداقل 50 الی 200 و شیوههای تبدیل غیرموازی نیازمند چندین برابر این تعداد جمله از گوینده هدف هستند. این تحقیق شیوهای را معرفی میکند که با کمک آن با داشتن تنها یک کلمه از گوینده هدف، تمام واکههای زبان فارسی از آن گوینده تولید میشوند. چون در هر کلمه حداقل یک هجا و در هر هجا یک واکه وجود دارد. هر کلمه از گوینده هدف حداقل حاوی یک هجا است. اندیشه اصلی تحقیق طراحی ترادیسهایی (تبدیلاتی) مستقیم بین یک واکه و سایر واکهها و تولید مستقیم تمام واکهها از روی آن است. بر این اساس با تولید یک مجموعه ترادیسها (تبدیلات) که به صورت برونخط آموزش میبینند، میتوان از روی یک واکه مابقی واکهها را تولید کرد. با توجه به اینکه در زبان فارسی 6 واکه وجود دارد، در عمل به طراحی 30 ترادیس (تبدیل) نیاز است. این ترادیسها (تبدیلات) با استفاده از توابع گوسی شرطی طراحی و پیادهسازی و با استفاده از 10 گوینده آموزشی بهصورت باسرپرستی آموزش داده شدند. براساس معیار فاصله دُشپیچی (اعوجاج)، میانگین فاصله واکههای ابداعی از این شیوه و واکههای واقعی برابر با 0/4459 است.
نوع مطالعه:
پژوهشي |
موضوع مقاله:
آوصوتیّات دریافت: 1393/4/21 | پذیرش: 1393/9/11 | انتشار: 1393/12/28