Entretien avec Arnaud Dessein - 1ère partie

11 avr. 2013

Écrit par Amenel 0 Commentaires

En décembre 2012, j'ai assisté à la soutenance de thèse d'un jeune chercheur de l'IRCAM (Institut de recherche et coordination acoustique/musique), Arnaud Dessein. Il a bien gentiment accepté de se prêter au jeu des questions-réponses. Voici le résultat de cette très sérieuse interview…

Quel est le champ de vos recherches ?

Mes recherches se situent dans le cadre des sciences et technologies de l’information et de la communication. Je m’intéresse en particulier au traitement numérique du signal et à l’apprentissage automatique par l’ordinateur (ou intelligence artificielle). Dans ce cadre, les objectifs scientifiques majeurs sont d’analyser des signaux (images, vidéos, textes, signaux de parole ou de musique, données médicales, génétiques, biologiques, géologiques, financières, etc.) avec l’ordinateur, afin d’en extraire des informations pertinentes pour des traitements spécifiques.

Au cours de ma thèse, je me suis principalement concentré sur les signaux audio, notamment les signaux de musique. J’ai abordé deux problématiques complexes et importantes dans ce contexte: la segmentation automatique de flux sonores et la transcription automatique de musique polyphonique, pour lesquelles j’ai développé des systèmes informatiques qui analysent les signaux sonores en temps réel afin de calculer la segmentation ou la transcription.

Pouvez-vous nous parler de la transcription automatique de musique polyphonique en temps réel ?

La transcription automatique de musique est un domaine actif du traitement du signal audio. L’idée est d’utiliser l’ordinateur pour analyser un morceau de musique, donné comme une simple forme d’onde sonore de bas niveau (telle qu’encodée dans un fichier ou un flux audio par l’ordinateur), pour en extraire de l’information de haut niveau sur le contenu musical symbolique (tel que représenté dans un fichier MIDI ou sur une partition de musique).

Pour le cas de la transcription de musique polyphonique (c’est-à-dire lorsque plusieurs sons peuvent se superposer, contrairement à la musique monophonique où un seul son est joué à la fois), les recherches actuelles se concentrent sur l’extraction de trois informations primordiales: les différentes hauteurs des notes jouées, leur temps d’apparition, et leur temps d’extinction.

Les intérêts technologiques de la transcription de musique (polyphonique ou non, temps réel ou non) sont multiples. Avant toute chose, il faut déjà préciser que la transcription automatique par l’ordinateur n’a pas pour vocation de remplacer le musicien capable de transcrire la musique d’oreille. La transcription automatique se veut plutôt une aide technologique complémentaire.

À suivre…


Tags : , , ,

Commentaires

Personne n'a encore commenté cette page.

Flux RSS pour les commentaires de cette page Flux RSS pour tous les commentaires

Écrire un commentaire

Vous ne pouvez pas poster de commentaires tant que vous n'êtes pas connecté. Se connecter.