PROCESAMIENTO DIGITAL SEÑALES.
Enviado por tolero • 6 de Septiembre de 2017 • 1.056 Palabras (5 Páginas) • 674 Visitas
...
[pic 19]
El modelo se asemeja a su cubierta espectral de la voz (basado en el oído puesto que es más sensible al espectro de amplitud que a la fase espectro).
- Procesamiento LP en la práctica
El modelo LP se aplica sobre tazas de voz (30 ms de largo, con una superposición de 20 ms), en la que la señal se supone que es estacionaria dada la inercia del articulatorio de músculos. Muestras del speech serán medidas utilizando una ventana de ponderación (ventana Hamming 30 ms).
Los (k=0 ... p) coeficientes de auto correlación: un número limitado de muestras 240, durante 30 ms de speech con una frecuencia de muestreo de 8 kHz, esto conduce a p=10.), p se elige con el número de polos en el filtro, de tal manera que el filtro de síntesis resultante tiene suficientes grados de libertad para copiar la cubierta espectral de la voz de entrada. Al no ser kHz de ancho de banda, por lo menos 2* B polos son requeridos (B es el ancho de banda de la señal en kHz, es decir, la mitad de la toma de frecuencias muestreadas). Dos polos más se añaden habitualmente para modelar el ciclo glotal forma de onda. [pic 20]
[pic 21]
Fig. 3 Sistema de análisis-síntesis de voz predictivo lineal
- Codificadores predictivos lineales
Se implementa el llamado estándar de la OTAN LPC10, esta norma codifica el speech con una tasa de 2400 bits/s (marcos de 22,5 m de largo, y cada cuadro es codificado con 54 bits de: 7 bits para el tono y V/UV, 5 bits para la ganancia, 42 bits para los coeficientes de predicción). El codificador LPC10 es sensible a la eficiencia de la detección de V/UV y Fo algoritmos de estimación. Para mejorar la calidad de la voz LPC se reduce las restricciones a la excitación LPC, a fin de mejorar la modelización del correo residual de predicción e(n) por la excitación e ̃(n). Pasando este residuo en el filtro de síntesis 1/A(z) produce el speech original. El Multi-Pulse Excited , la excitación MPE se caracteriza por las posiciones y amplitudes de un número limitado de impulsos por fotograma (10 pulsos por 10 ms).
Se eligen posiciones y amplitudes de pulso iterativamente a fin de minimizar la energía del error de modelado (la diferencia entre el habla original y el habla sintética). los errores filtrada por un filtro perceptual antes de que se calcula su energía:
[pic 22]
[pic 23]
Fig. 4 Estimación de la excitación MPE por un bucle de análisis por síntesis en el Codificador MPE
El codificador de predicción lineal con excitación por código (CELP): Usa el modelo de fuente-filtro de la producción del speech a través del LP, libro de códigos estocastico fijo como entrada (excitación) del modelo LP, realiza una búsqueda en bucle cerrado, aplicación de cuantificación vectorial (VQ))
CELP aprovecha la periodicidad de sonidos sonoros para mejorar aún más la eficiencia predictor. El predictor a largo plazo, el filtro está en cascada con el filtro de síntesis, lo que mejora la eficiencia del libro de códigos. El más simple predictor a largo plazo consiste en una sencilla variable de retraso con ganancia ajustable.
[pic 24]
Fig. 1.10 Estimación de la excitación CELP por un bucle de análisis por síntesis in el codificador CELP
Las nuevas generaciones de programadores que se utilizan en los teléfonos celulares son todos basados en el principio CELP y puede funcionar a velocidades de bits tan bajas como 4,75 kb/s a 11,2 kb/s
...