<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Journal of Acoustical Society of Iran</title>
<title_fa>مجله انجمن علوم صوتی ایران (مهندسی صوتیات سابق)</title_fa>
<short_title>مجله انجمن علوم صوتی ایران (مهندسی صوتیات سابق)</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://joasi.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2345-5748</journal_id_issn>
<journal_id_issn_online>2345-5748</journal_id_issn_online>
<journal_id_pii>8</journal_id_pii>
<journal_id_doi>7</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid>14</journal_id_sid>
<journal_id_nlai>8888</journal_id_nlai>
<journal_id_science>13</journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1399</year>
	<month>12</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2021</year>
	<month>3</month>
	<day>1</day>
</pubdate>
<volume>8</volume>
<number>2</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>بهبود میانگین دقت طبقه‌بندیِ واکه‌هایِ فارسی از روی علامتِ گفتار با استفاده از شبکۀ عصبیِ هم‌گشتال (مقاله پژوهشی)</title_fa>
	<title>Improving the average precision of Persian vowel classification from speech signal by using convolutional neural network (Research Article)</title>
	<subject_fa>پردازش علائم صوتی</subject_fa>
	<subject>Signal Processing</subject>
	<content_type_fa>كاربردي</content_type_fa>
	<content_type>Applicable</content_type>
	<abstract_fa>&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;color:black;&quot;&gt;&lt;span style=&quot;font-family:B Nazanin;&quot;&gt;یکی از روی&#8204;کردهای بازشناسیِ گفتار، الگو کردن گفتار بر مبنای تعدادی واحد آوایی است. با توجه به این&#8204;که مشخصات بسامدی و زمانی واکه&#8204;ها، پایدارتر از سایر واج&#8204;ها هستند، تشخیص واکه&#8204;ها برای تشخیص گفتار مهم است. &lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;color:black;&quot;&gt;&lt;span style=&quot;font-family:B Nazanin;&quot;&gt;در این پژوهش، هدف ارائه الگویی با استفاده از روش&#8204;های نوین، نظیر شبکۀ عصبی عمیق برای بهبود دقت تشخیص واکه و افزایش کاربردهای آن است. 30 گوینده (15 زن و 15 مرد)، تمامی حالت&#8204;های ترکیب&#8204; هم&#8204;خوان&#8204;ها با شش واکۀ فارسی را می&#8204;خوانند. دادگان گفتاری پس از پردازش &lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;color:black;&quot;&gt;&lt;span style=&quot;font-family:B Nazanin;&quot;&gt;به قاب&#8204;های حاوی فقط واکه بخش&#8204;بندی شده و اسپکتروگرام آن استخراج می&#8204;شود. اسپکتروگرام به&#8204;دست آمده، به&#8204;عنوان ورودی به شبکۀ عصبی پیچشی با دو لایۀ پنهان داده می&#8204;شود. دادگان 25 گوینده برای آموزش و 5 گوینده برای آزمون به&#8204;کار برده شده&#8204;اند. میانگینِ دقتِ تشخیص شش واکۀ فارسی برای الگوی پیشنهادی 93&lt;sub&gt;/&lt;/sub&gt;17 درصد (میانگین خطای 6&lt;sub&gt;/&lt;/sub&gt;83 درصد) به&#8204;دست آمده است که نسبت به کارهای پیشین که میانگین خطایِ تشخیص واکه 9&lt;sub&gt;/&lt;/sub&gt;7 &lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;color:black;&quot;&gt;&lt;span style=&quot;font-family:B Nazanin;&quot;&gt;درصد الی &lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;color:black;&quot;&gt;&lt;span style=&quot;font-family:B Nazanin;&quot;&gt;19&lt;sub&gt;/&lt;/sub&gt;6 &lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;color:black;&quot;&gt;&lt;span style=&quot;font-family:B Nazanin;&quot;&gt;درصد (کم&#8204;ترین و بیش&#8204;ترین میانگین خطا در الگو&#8204;های موجود) بوده،&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;color:black;&quot;&gt;&lt;span style=&quot;font-family:B Nazanin;&quot;&gt; 2&lt;sub&gt;/&lt;/sub&gt;87 درصد الی 12&lt;sub&gt;/&lt;/sub&gt;77 درصد بهبود یافته است.&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;
&amp;nbsp;</abstract_fa>
	<abstract>&lt;div style=&quot;text-align: justify;&quot;&gt;One approach to speech recognition is to model speech based on a number of phonetic units. Because the frequency and temporal characteristics of vowels are more stable than other phonems, it is important to recognize vowels to distinguish speech. In this research, the aim is to present a model using modern methods, such as deep neural network to improve the accuracy of vowel recognition and increase its applications. 30 speakers (15 females and 15 males) read all the combinations of consonants with 6 Persian vowels. After preprocessing, the speech data is segmented into frames containing only the vowels and its spectrogram is extracted. These spectrogram are given as input to the neural network with two hidden layers. Speech of 25 speakers were used for training and speech of 5 speakers were used for testing. The average of accuracy of 6 Persian vowels for the proposed model was 93.17% (total average of vowel detection error is 6.83%). In previous works the average of vowel detection error was 9.7% to 19.6% that in proposed model improved from 2.87% to 12.77%.&lt;/div&gt;</abstract>
	<keyword_fa>تشخیص واکه‌های فارسی, شبکۀ عصبی هم‌گشتال (کانولوشنال), طبقه‌بندی, دادگان فارسی.</keyword_fa>
	<keyword>Persian vowel recognition, Classification, Convolutional neural network, Persian vowel dataset.</keyword>
	<start_page>51</start_page>
	<end_page>59</end_page>
	<web_url>http://joasi.ir/browse.php?a_code=A-10-996-1&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>M.</first_name>
	<middle_name></middle_name>
	<last_name>Asgari</last_name>
	<suffix></suffix>
	<first_name_fa>محمد</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>عسگری</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>m.asgari@iribu.ac.ir</email>
	<code>10031947532846002783</code>
	<orcid>10031947532846002783</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>IRIB</affiliation>
	<affiliation_fa>صدا و سیمای جمهوری اسلامی ایران</affiliation_fa>
	 </author>


	<author>
	<first_name>N.</first_name>
	<middle_name></middle_name>
	<last_name>Akbari</last_name>
	<suffix></suffix>
	<first_name_fa>نرگس</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>اکبری</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>nargesakbari@iribu.ac.ir</email>
	<code>10031947532846002784</code>
	<orcid>10031947532846002784</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>IRIB</affiliation>
	<affiliation_fa>صدا و سیمای جمهوری اسلامی ایران</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
