Paso 4 - Creación de los archivos de transcripción
Transcripciones de niveles de palabras
HTK toolkit no puede procesar su archivo prompts.txt directamente . Tiene dos opciones, puede crear un archivo separado de "etiqueta" para cada línea de su archivo prompts.txt en el siguiente formato:
*/muestra1
MARCAR
UNO
DOS
TRES
CUATRO
CINCO
SEIS
SIETE
OCHO
NUEVE
OH
CERO
O puede crear un archivo de etiqueta maestra (MLF), que es un único archivo que contiene una entrada de etiqueta para cada línea en el archivo prompts.txt. Este es el enfoque más fácil y el que usaremos para este tutorial.
Descargue el script Julia prompts2mlf.jl (https://raw.githubusercontent.com/VoxForge/develop/master/bin/prompts2mlf.jl) a su directorio 'voxforge/bin'
wget https://raw.githubusercontent.com/VoxForge/develop/master/bin/prompts2mlf.jl
para generar el archivo mlf desde su archivo prompts.txt. Ejecute el script prompts2mlf desde su carpeta 'voxforge/tutorial' de la siguiente manera:
julia ../bin/prompts2mlf.jl prompts.txt palabras.mlf
Este script genera un archivo palabras.mlf.
Transcripciones a nivel de fonema
A continuación, debe ejecutar el comando HLEd para expandir las Transcripciones de Nivel de Palabra a Transcripciones de Nivel de Fonema - es decir, reemplazar cada palabra por sus fonemas y colocar el resultado en un nuevo Archivo de Etiqueta Maestra de Nivel de Fonema. Esto se hace revisando cada palabra del archivo MLF y buscando los fonemas que componen esa palabra en el archivo dict que creó anteriormente, la salida del resultado en un archivo llamado fonemas0.mlf (que no tendrá pausas cortas ("sp"s) después de cada grupo de teléfono de la palabra).
Primero, crea el script de edición mkfonemas0.led en tu carpeta 'voxforge/tutorial':
EX
IS sil sil
DE sp
(Nota: recuerde incluir una línea en blanco al final de este guión)
A continuación, ejecute el siguiente comando HLEd desde la carpeta 'voxforge/tutorial':
Linux:
../soft/htk/HTKTools/HLEd -A -D -T 1 -l '*' -d dict -i fonemas0.mlf mkfonemas0.led palabras.mlf
Windows:
C:>HLEd -A -D -T 1 -l * -d dict -i fonemas0.mlf mkfonemas0.led palabras.mlf
Que crea el archivo fonemas0.mlf
A continuación, necesitamos crear un segundo archivo fonemas1.mlf (que incluirá pausas cortas ("sp") después de cada grupo de fonemas de palabras). Primero crea el mkfonemas1.led en tu carpeta 'voxforge/tutorial' como sigue:
EX
IS sil sil
(Nota: recuerde incluir una línea en blanco al final de este guión)
A continuación, ejecute el comando HLEd de nuevo desde su carpeta 'voxforge/tutorial' de la siguiente manera:
Linux:
../soft/htk/HTKTools/HLEd -A -D -T 1 -l '*' -d dict -i fonemas1.mlf mkfonemas1.led palabras.mlf
Ventanas:
C:> HLEd -A -D -T 1 -l * -d dict -i fonemas1.mlf mkfonemas1.led palabras.mlf
Que crea el archivo fonemas1.mlf .
Transcripciones de niveles de palabras
HTK toolkit no puede procesar su archivo prompts.txt directamente . Tiene dos opciones, puede crear un archivo separado de "etiqueta" para cada línea de su archivo prompts.txt en el siguiente formato:
*/muestra1
MARCAR
UNO
DOS
TRES
CUATRO
CINCO
SEIS
SIETE
OCHO
NUEVE
OH
CERO
O puede crear un archivo de etiqueta maestra (MLF), que es un único archivo que contiene una entrada de etiqueta para cada línea en el archivo prompts.txt. Este es el enfoque más fácil y el que usaremos para este tutorial.
Descargue el script Julia prompts2mlf.jl (https://raw.githubusercontent.com/VoxForge/develop/master/bin/prompts2mlf.jl) a su directorio 'voxforge/bin'
wget https://raw.githubusercontent.com/VoxForge/develop/master/bin/prompts2mlf.jl
para generar el archivo mlf desde su archivo prompts.txt. Ejecute el script prompts2mlf desde su carpeta 'voxforge/tutorial' de la siguiente manera:
julia ../bin/prompts2mlf.jl prompts.txt palabras.mlf
Este script genera un archivo palabras.mlf.
Transcripciones a nivel de fonema
A continuación, debe ejecutar el comando HLEd para expandir las Transcripciones de Nivel de Palabra a Transcripciones de Nivel de Fonema - es decir, reemplazar cada palabra por sus fonemas y colocar el resultado en un nuevo Archivo de Etiqueta Maestra de Nivel de Fonema. Esto se hace revisando cada palabra del archivo MLF y buscando los fonemas que componen esa palabra en el archivo dict que creó anteriormente, la salida del resultado en un archivo llamado fonemas0.mlf (que no tendrá pausas cortas ("sp"s) después de cada grupo de teléfono de la palabra).
Primero, crea el script de edición mkfonemas0.led en tu carpeta 'voxforge/tutorial':
EX
IS sil sil
DE sp
(Nota: recuerde incluir una línea en blanco al final de este guión)
A continuación, ejecute el siguiente comando HLEd desde la carpeta 'voxforge/tutorial':
Linux:
../soft/htk/HTKTools/HLEd -A -D -T 1 -l '*' -d dict -i fonemas0.mlf mkfonemas0.led palabras.mlf
Windows:
C:>HLEd -A -D -T 1 -l * -d dict -i fonemas0.mlf mkfonemas0.led palabras.mlf
Que crea el archivo fonemas0.mlf
A continuación, necesitamos crear un segundo archivo fonemas1.mlf (que incluirá pausas cortas ("sp") después de cada grupo de fonemas de palabras). Primero crea el mkfonemas1.led en tu carpeta 'voxforge/tutorial' como sigue:
EX
IS sil sil
(Nota: recuerde incluir una línea en blanco al final de este guión)
A continuación, ejecute el comando HLEd de nuevo desde su carpeta 'voxforge/tutorial' de la siguiente manera:
Linux:
../soft/htk/HTKTools/HLEd -A -D -T 1 -l '*' -d dict -i fonemas1.mlf mkfonemas1.led palabras.mlf
Ventanas:
C:> HLEd -A -D -T 1 -l * -d dict -i fonemas1.mlf mkfonemas1.led palabras.mlf
Que crea el archivo fonemas1.mlf .