Abstract:
En el presente trabajo se analiza el problema de realizar la transcripción musical de una señal de audio en tiempo real al formato estándar MIDI, utilizando una tarjeta de procesamiento digital de señales y una computadora. Se realizaron diferentes experimentos para obtener el reconocimiento de 60 notas musicales de un piano digital por medio de técnicas de procesamiento digital de señales y clasificadores utilizados en inteligencia artificial.
En la etapa de técnicas de procesamiento digital de señales se utilizaron: Tono fundamental (F0), Coeficientes Cepstrales en la Frecuencia de Mel (MFCC) y Cepstrales de Mecánica Coclear (CMCC). Para los clasificadores se consideraron Modelos Ocultos de Markov de Densidad Continua (CD-HMM), Modelos de Mixturas Gaussianas (GMM), Redes Neuronales Artificiales (ANN) y Cuantificación Vectorial (VQ).
Fue necesario dividir el trabajo por etapas de experimentación, en la primera de ellas el corpus consistió en 60 notas comprendidas en un rango de cinco octavas grabadas fuera de tiempo real por medio de un piano digital. Se usaron 12 archivos para cada una de las 60 notas a reconocer, las cuales se grabaron a una velocidad 70 ppm (pulsos por minuto). En la siguiente etapa el corpus comprendió el mismo rango de notas y misma velocidad pero a diferencia del corpus anterior, en este caso la grabación se realizó por medio de un teclado musical y la tarjeta del DSP haciendo uso de la tecnología RTDX para aplicaciones en tiempo real.
Se realizó una comparación entre los diferentes clasificadores y características empleados en cada etapa de experimentación para determinar cuál es la mejor opción para reconocimiento de notas musicales. Finalmente se hizo la transcripción automática para cuatro melodías diferentes grabadas fuera de tiempo real, obteniendo el 100% de reconocimiento en algunas de ellas. Por otro lado se hizo la transcripción automática de dos melodías grabadas en tiempo real obteniendo como porcentaje más alto un 76.08% en una de ellas. De esta manera se reflejan los resultados de un transcriptor fuera de tiempo real y otro con melodías grabadas en tiempo real al mismo tiempo que con resultados existentes en el estado del arte.
Description:
Tesis (Maestría en Ciencias en Ingeniería de Cómputo), Instituto Politécnico Nacional, Centro de Investigación en Computación, 2017, 1 archivo PDF, (132 páginas). tesis.ipn.mx