Optimización de Síntesis de Voz mediante Análisis de Componentes Principales

Manuel Haro Marquez, Miguel Ángel Fraire Hernández, Luis Alberto Flores Chaires, María del Rosario Bernal Díaz, Fabian Navarrete Rocha, Noe Buenrostro Domínguez, Ana Lourdes Borrego Elías, Ana Luisa Hernández Gutiérrez, Nadia Garibay Rendón, Lorena Raquel Casanova Luna, Jaquelinne Martínez Robles, Luis Enrique Paredes Berumen, Jose Manuel Cervantes Miramontes, Claudia Sifuentes Gallardo, Margarita Selene Salazar Ávila, Abubeker Gamboa Rosales, César Gamboa Rosales

Abstract


Los sistemas de síntesis de voz por concatenación proporcionan una alta calidad debido a la mejora en sus métodos de selección de unidades acústicas. Sin embargo, la calidad de síntesis de voz depende de la posición adecuada de los puntos de concatenación en la secuencia de unidades acústicas a concatenar que componen una señal de voz sintetizada. La posición de los puntos de concatenación en gran medida determina el grado de distorsión percibida por el humano en una voz sintética. Por lo tanto, presentamos un algoritmo de fijación del punto óptimo de concatenación entre unidades acústicas que se basa en el análisis de componentes principales para la reducción de la distorsión acústica percibida por el oyente en un sistema de síntesis de voz. Este algoritmo propone la extracción de parámetros espectrales en referencia a un punto de concatenación y su transformación mediante el análisis de componentes principales en una representación parsimoniosa la cual representa las propiedades más relevantes de la señal de voz. Posteriormente, se determina el punto óptimo de concatenación mediante un proceso iterativo de mejora continua. Finalmente, los resultados experimentales del método de punto de concatenación optimización propuesto son analizados.

Full Text:

PDF


DOI: http://dx.doi.org/10.52155/ijpsat.v10.1.572

Refbacks

  • There are currently no refbacks.


Copyright (c) 2018 Manuel Haro Marquez, Fabián Navarrete Rocha

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.