Implementación de un Identificador de Sonido en Python

Speaker(s) Cameron Macleod

El tema que nos ocupa es como implementar un identificador de sonido tipo Shazam usando técnicas DSP con ayuda de unas fantásticas bibliotecas. Los puntos a seguir serán, implementación, retos y pasos adicionales. El proyecto que nos ocupa se encuentra todavía en proceso de desarrollo (el código subido en GitHub) y fue inspirado después la conferencia, Over-the-Air Audio Identification en FOSDEM 2016.

La estructura básica del proyecto consiste en un clasificador y un reconocedor. El clasificador toma huellas del sonido y las procesa en una forma investigable para el reconocedor que usa estas huellas para la identificación y búsqueda de archivos almacenados con el fin de encontrar la semejanza mas probable. El reconocedor estará expuesto en un entorno API.

La conferencia intentará introducir el área de DSP a la audiencia y los conceptos que están detrás aplicaciones como Shazam. Explicaré todos las nociones incluidas en una manera sencilla.

Presentación

in on Tuesday 19 July at 14:00 See schedule

Do you have some questions on this talk?

New comment

Comment

Name

Email address

URL

Captcha