Journal of Acoustical Society of Iran
مجله علمی پژوهشی انجمن علوم صوتی ایران
مجله علمی پژوهشی انجمن علوم صوتی ایران
Engineering & Technology
http://joasi.ir
1
admin
2345-5748
2345-5748
8
7
14
8888
13
fa
jalali
1395
5
1
gregorian
2016
8
1
4
1
online
1
fulltext
fa
بازیابی موسیقی مبتنی بر نمونه با کاربرد تشخیص ژانر جهت بهبود سرعت عملکرد
Query-by-example music retrieval using genre recognition to speed up the performance
پژوهشي
Research
<p><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">هدف یک سامانه باز</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ی</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">اب</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ی</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;"> اطلاعات موس</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ی</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ق</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ی با دریافت یک نمونه</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">، باز</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ی</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">اب</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ی</span></span> <span style="font-family:b nazanin;"><span style="font-size:11.0pt;">آهنگ متناظر</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;"> با نمونۀ پرسوجو</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ی</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;"> کاربر از </span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ی</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ک دادگان خاص است. این نمونه میتواند یک قطعۀ چند ثانیهای ضبطشده از هر منبع پخشکننده موس</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ی</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ق</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ی مانند تلویزیون یا حتی</span></span> <span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ی</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ک مح</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ی</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ط نوفهای، مانند ورزشگاه باشد. در ا</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ی</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ن مقاله، </span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ی</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ک سامانه باز</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ی</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">اب</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ی</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;"> اطلاعات موس</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ی</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ق</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ی</span></span> <span style="font-family:b nazanin;"><span style="font-size:11.0pt;">مبتنی بر نمونه با کاربرد تشخیص ژانر پیشنهاد شده است، که هدف آن، نشاندادن اثر کاربرد تشخیص ژانر موسیقی برای دستیابی به عملکرد دقیق و سریع در چنین سامانههایی حتی در حضور نوفۀ پسزمینه است. این سامانه شامل دو بلوک تشخیص ژانر و تطبیق- بازیابی است. در تشخیص ژانر از یک درخت تصمیم دودویی و در تطبیق- بازیابی از دو فاصلۀ اقلیدسی و واگرایی کولبک- لیبلر (کِیاِل) بههمراه یک روش ترکیب تصمیم مبتنی بر امتیازدهی استفاده ­شده است. سامانه پیشنهادی بر روی دادگان شناختهشدۀ جیتیزان (ارائه شده توسط </span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">جرج زانتاکیس</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">) و با دو دستۀ تصادفی از علامتهای پرسوجو</span></span><span style="font-family:b nazanin;"><span style="font-size:11.0pt;">ی</span></span> <span style="font-family:b nazanin;"><span style="font-size:11.0pt;">خالص و نوفهای ارزیابی ­شد. نتایج، دستیابی به صحت 97% و 86% را به ترتیب برای دو حالت خالص و نوفهای در زمان بازیابی 525 میلیثانیه با فاصلۀ اقلیدسی نشان میدهند. این مقادیر برای فاصلۀ کِیاِل به 97% و 82% با زمان بازیابی 380 میلیثانیه میرسند.</span></span></p>
<div style="text-align: justify direction: ltr">
<p>The goal of a query-by-example music information retrieval system is retrieval of the target song corresponding to user-provided example from a particular dataset. The example can be a few second piece recorded from any music source such as TV or even a noisy environment e.g. gym. In this paper, a query-by-example system for music retrieval using genre recognition is proposed whose goal is to show the effect of genre recognition to achieve the accurate and rapid performance in such systems even in presence the background noise. This system includes two basic blocks: genre recognition and matching-retrieval. A binary decision tree performs the genre recognition and matching-retrieval uses two Euclidean and Kullback-Leibler (KL) distances along with a score level based decision fusion. The proposed system is evaluated on the well-known GTZAN dataset (prepared by George Tzanetakis) and by two random groups of pure and noisy queries. The results show the accuracy of 97% and 86% for two pure and noisy query groups, respectively, in retrieval time of 525 ms with Euclidean distance. These values are 97% and 82% in retrieval time of 380 ms with KL distance.</p>
<div>
<hr align="left" size="1" width="33%" >
<div id="ftn1"><p></p></div>
</div>
</div>
بازیابی اطلاعات موسیقی, پرسوجو با دریافت نمونه, تشخیص ژانر, ترکیب تصمیم, نوفه.
Music information retrieval, Query by example, Genre recognition, Decision fusion, Noise.
1
20
http://joasi.ir/browse.php?a_code=A-10-112-1&slc_lang=fa&sid=1
N.
Borjian
نسترن
برجیان
nastaran.borjian@modares.ac.ir
10031947532846001014
10031947532846001014
Yes
Department of Electrical and Computer Engineering
دانشکده مهندسی برق و کامپیوتر
E.
Kabir
احساناله
کبیر
10031947532846001015
10031947532846001015
No
. Department of Electrical and Computer Engineering
دانشکده مهندسی برق و کامپیوتر
S.
Seyedin
ساناز
سیدین
10031947532846001016
10031947532846001016
No
Department of Electrical Engineering
دانشکده مهندسی برق
E.
Masehian
الیپس
مسیحی
10031947532846001017
10031947532846001017
No
Faculty of Engineering
دانشکده فنی و مهندسی