Entretien avec Arnaud Dessein - 3è partie

9 mai 2013

Écrit par Amenel 0 Commentaires

Troisième et dernière partie de l'entretien avec Arnaud Dessein. Retrouvez ici la première partie.

Quelles sont les difficultés techniques de la transcription de la musique ?

Les difficultés principales de la transcription de musique résident dans la complexité des signaux musicaux. Dans un contexte où on cherche à transcrire les hauteurs des notes jouées, il n’est déjà pas évident de déterminer exactement la hauteur (ou fréquence fondamentale) d’une source monophonique. Lorsque plusieurs hauteurs (on parle alors de fréquences fondamentales multiples) peuvent se superposer, le problème devient alors bien plus complexe. Cette tâche est considérée comme difficile en traitement du signal audio, et elle est encore loin d’être maîtrisée pour obtenir des transcriptions parfaites ou proches de celles que le musicien expert est capable de produire.

Non seulement l’aspect combinatoire du problème devient un obstacle, puisqu’il faut être capable de prendre en compte les différentes combinaisons de notes possibles, mais il faut de surcroît prendre en compte le mélange de ces différentes notes. En d’autres termes, même si l’on sait transcrire parfaitement un son seul, il ne suffit pas de répéter ce procédé pour transcrire plusieurs sons superposés. Il faut également pouvoir en quelque sorte séparer les contributions des différents sons. L’enjeu est de taille car différents instruments peuvent potentiellement jouer plusieurs notes différentes simultanément.

De plus, la majeure partie des systèmes de transcription actuels fonctionnent en temps différé: ils analysent un extrait de musique déjà encodé entièrement dans l’ordinateur pour fournir la transcription, et parfois avec des temps de calcul relativement longs pouvant largement dépasser la durée du morceau à transcrire en lui-même. Pour réaliser une transcription en temps réel, il faut alors savoir gérer le fait que le morceau de musique n’est pas entièrement encodé à l’avance et n’est disponible à l’ordinateur qu’au fur et à mesure qu’il est joué. Il faut ensuite que l’ordinateur, à l’instar d’un très bon musicien, soit capable de réagir rapidement quand le flux musical arrive, afin de traiter et transcrire les données musicales arrivées avant que les données suivantes n’arrivent.


Tags : , , ,

Commentaires

Personne n'a encore commenté cette page.

Flux RSS pour les commentaires de cette page Flux RSS pour tous les commentaires

Écrire un commentaire

Vous ne pouvez pas poster de commentaires tant que vous n'êtes pas connecté. Se connecter.