Sistemas de Classificação Automática em Géneros Musicais
Authors
Abstract
The massification of computer use, and the availability of Internet access with increasing available bandwidth, created conditions to the tremendous growth that the industry of electronic music delivery has experienced in the last few years. This growth is also related to the ease that, at the speed of one click, one can access huge music databases. Those databases must be permanently updated with all the music that is produced every day and must also be organized according to the defined taxonomies, so that they give the best possible answer to user's queries.The process of music labeling according to the used taxonomies is more and more difficult to carry out manually due to time necessary and the subjectivity of the task. Therefore, it becomes necessary to use the computer as a tool for automatic classification.
Classification systems involve tasks such as the extraction of features from each musical piece and the development of classifiers that use the extracted features.
Regarding feature extraction, in this work we use the zcr, loudness, centroid, bandwidth and uniformity. These features are statistically manipulated, making a total of 40 features for each piece of music.
Then, three classifiers were used: KNN, GMM and MLP. The classification consisted on three problems, all of them related to classical music. In the first one, the goal was to discriminate between music for flute, piano and violin. In the second problem, we aimed to separate choral music from opera. Finally, in the third problem, the classification was conducted using the five referred genres.
After comparing the results obtained with the three classifiers, we came to the conclusion that MLP originated the best results in all the classification tasks, achieving accuracies of 85%, 90% and 76% for the first, second and third problems, respectively.
This classifier was then used for approximating an automatic music genre classification system. In this system, each musical piece was represented by ten extracts, chosen in the same manner for all the pieces. Each piece was then classified according to the extract's most represented musical genres.
------------------------------------------------------------------------------------------------------------------
Como resultado da massificação do computador, do aumento generalizado da largura de banda disponÃvel e da universalização da Internet, a indústria da distribuição electrónica de música teve um enorme crescimento nos últimos anos. Esse crescimento está também relacionado com a facilidade com que à velocidade de um clique se pode aceder a bases de dados de música de grandes dimensões. Essas bases de dados têm de estar sempre actualizadas com toda a música que é produzida diariamente e têm de estar organizadas de acordo com as taxonomias definidas para poder responder da melhor maneira à s pesquisas dos utilizadores.
A catalogação de peças musicais com base nas taxonomias utilizadas, é um processo cada vez mais difÃcil de realizar de uma forma manual, devido a questões de tempo e de eficiência de quem as faz. Surgiu portanto a necessidade da utilização do computador para a criação de sistemas de classificação automáticos.
Este tipo de sistemas envolve tarefas como a extracção de caracterÃsticas de cada música e o desenvolvimento de classificadores que utilizem as caracterÃsticas extraÃdas.
Quanto à extracção de caracterÃsticas, utiliza-se neste trabalho o zcr, loudness, centróide, largura de banda e uniformidade. Estas caracterÃsticas são estatisticamente manipuladas fazendo um total de 40 caracterÃsticas para cada música.
Em seguida são utilizados três classificadores: KNN, GMM e MLP. A classificação consistiu em três problemas, todos relacionados com a música clássica. No primeiro pretendeu-se discriminar entre música para flauta, piano e violino. No segundo problema pretendeu-se distinguir música coral de ópera. Finalmente no terceiro classificou-se num dos 5 géneros musicais anteriores.
Após a comparação dos resultados dos classificadores, chegou-se à conclusão que o MLP originou os melhores resultados em todas as tarefas de classificação, conseguindo percentagens de músicas bem classificadas de 85%, 90% e 76% respectivamente para os primeiro, segundo e terceiro problema de classificação.
Este classificador foi então utilizado para fazer uma aproximação a um sistema de classificação automático de géneros musicais. Neste sistema, cada música foi representada por dez extractos escolhidos de igual forma para todas as músicas. Cada música foi classificada no género musical mais representado pelos seus extractos.