Redes Neuronales y el Reconocimiento de Habla
Enviado por MIGJ • 31 de Mayo de 2023 • Examen • 4.496 Palabras (18 Páginas) • 250 Visitas
Introducción
[pic 1]
UNIVERSIDAD FRANCISCO DE VITORIA
ESCUELA POLITÉCNICA SUPERIOR
GRADO EN INGENIERÍA INFORMÁTICA
Redes Neuronales y el Reconocimiento de Habla
Juan José Cuesta Fernández (53766534D)
Juan Manuel Gómez Diosdado (
Pablo Gómez Grande (
Inteligencia Artificial II – Tercer curso
Índice de contenidos
1 Introducción 1
2 Redes Neuronales Artificiales 1
2.1. Arquitectura de un Reconocedor Automático de habla 3
Preprocesado 3
Filtro de preénfasis 4
Enmarcado 4
Transformada discreta de Fourier 5
Transformada discreta del coseno 5
Decisión 5
2.2. Reconocimiento de Patrones 6
3 Evolución de las redes neuronales y el reconocimiento del habla 7
4 Usos y Actualidad del Reconocimiento del Habla Utilizando Redes Neuronales 9
4.1. INDEPENDIENTES DE LOCUTOR 10
4.1.1. Telefonía: 10
4.2. DEPENDIENTES DE LOCUTOR 11
4.2.1. Control por Comandos 11
4.2.2. Dictado automático 12
5 Conclusiones y opinión personal 13
6 Bibliografía 14
Índice de figuras
Figura 1. Arquitectura de una red neuronal artificial…………………………………………....................... 6
Figura 2 – Arquitectura básica de Reconocimiento Automático de Habla.
Figura 3 – Gráfica sobre el porcentaje de errores en el dictado automático de la compañía Nuance.. 17
Introducción
En este trabajo vamos a profundizar en el tema de la Inteligencia Artificial y el reconocimiento del habla, y su evolución a lo largo del tiempo desde sus inicios. La cual dio sus primeros pasos en los años 50, avanzando de forma gigantesca cada año hasta el reconocimiento del habla que conocemos hoy en día. Está presente en muchos de los dispositivos y aplicaciones que usamos diariamente, ya sea Apple con Siri, o Microsoft con Cortana. Los cuales pueden facilitar a los usuarios el uso de dichos dispositivos, o la disponibilidad de información.
Además, se realizará un estudio detenido del funcionamiento de dicho algoritmo, que modelos neuronales utiliza y su modelo de arquitectura. Para que podamos entender con propiedad la complejidad que estos modelos conllevan y la importancia que tienen hoy en día.
El trabajo se dividirá en una serie de apartados, los cuales son:
1) En el primer apartado hablaremos de las redes neuronales, para que cuando hablemos de su uso en el reconocimiento del habla, sepamos qué son y cuál es su funcionamiento.
2) En el segundo apartado trataremos sobre la evolución del reconocimiento del habla. Desde sus inicios hasta ahora, como detallamos anteriormente.
3) En el tercer apartado se hablará de los usos y las áreas en las que se puede aplicar el reconocimiento del habla.
4) En el cuarto apartado daremos nuestras opiniones, sobre como seguirá avanzando este campo de la inteligencia artificial en un futuro.
5) Por último en el quinto apartado podremos encontrar las referencias bibliográficas usadas para documentarnos.
Redes Neuronales Artificiales
Una red neuronal artificial es una herramienta matemática que intenta imitar las neuronas del cerebro humano, por así decir, es un procesador. Un claro ejemplo sería reconocer la voz, en este caso el dato de entrada sería lo que se ha dicho y, mediante una serie de algoritmos, el patrón de salida sería la búsqueda de lo que se ha preguntado.
Para entender la arquitectura de las redes neuronales debemos saber que las neuronas se organizan en capas donde las situadas a la izquierda son las de entrada, las de la derecha son las de salida y las neuronas intermedias denominadas neuronas de la capa oculta son las que se encargan de realizar los cálculos. Todas estas neuronas suelen estar conectadas con todas las de la siguiente capa tal y como se puede observar.
Por otra parte, mencionar que cada neurona tiene asociado un valor denominado peso, este valor se utiliza para multiplicar el valor de la neurona con los pesos de las conexiones salientes. Una vez hecho eso, las neuronas de la siguiente capa suma todos los números que le lleguen (debido a que le llegan de distintas neuronas de la capa anterior).
[pic 2]
Figura 1. Arquitectura de una red neuronal artificial. http://www.medintensiva.org/es/redes-neuronales-artificiales-medicina-intensiva-/articulo/13071859/
Además de estas estructuras, también nos podemos encontrar con operaciones un poco más complicadas, por lo que todas las capas excepto la de entrada se encargan de realizar dichas operaciones, a esto se le llama función de activación.
A continuación, hablaremos de la fase de aprendizaje y de la de ejecución.
En la primera fase, se busca obtener un conjunto de pesos adecuado para poder realizar la tarea correctamente.
Esta primera fase a su vez se divide en otras 3:
- El aprendizaje supervisado donde los pesos se van modificando de forma proporcional al error de la salida con respecto a la salida esperada.
- El aprendizaje no supervisado donde los pesos se deben ajustar en base a la correlación existente entre los datos de entrada.
- Aprendizaje por refuerzo donde se le indica a la red si la salida obtenida es o no correcta. Este tipo de aprendizaje se suele situar entre los dos anteriores. Una vez terminada la fase de aprendizaje se comienza con la de ejecución de la tarea para la cual la red neuronal fue entrenada.
Arquitectura de un Reconocedor Automático de habla
Los sistemas de reconocimiento automático de habla que mejores resultados han dado son aquellos que utilizan la Teoría de la Decisión de Bayes, la Teoría de la información y las técnicas de Comparación de Patrones.
...