Ir al contenido principal

Marcelino - Paso 4 - Creación de los archivos de transcripción

Paso 4 - Creación de los archivos de transcripción

  Transcripciones de niveles de palabras

    HTK toolkit no puede procesar su archivo prompts.txt directamente . Tiene dos opciones, puede crear un archivo separado de "etiqueta" para cada línea de su archivo prompts.txt en el siguiente formato:

      */muestra1
      MARCAR
      UNO
      DOS
      TRES
      CUATRO
      CINCO
      SEIS
      SIETE
      OCHO
      NUEVE
      OH
      CERO

    O puede crear un archivo de etiqueta maestra (MLF), que es un único archivo que contiene una entrada de etiqueta para cada línea en el archivo prompts.txt. Este es el enfoque más fácil y el que usaremos para este tutorial.

    Descargue el script Julia prompts2mlf.jl (https://raw.githubusercontent.com/VoxForge/develop/master/bin/prompts2mlf.jl) a su directorio 'voxforge/bin'

      wget https://raw.githubusercontent.com/VoxForge/develop/master/bin/prompts2mlf.jl

    para generar el archivo mlf desde su archivo prompts.txt. Ejecute el script prompts2mlf desde su carpeta 'voxforge/tutorial' de la siguiente manera:

       julia ../bin/prompts2mlf.jl prompts.txt palabras.mlf

    Este script genera un archivo palabras.mlf.

  Transcripciones a nivel de fonema

    A continuación, debe ejecutar el comando HLEd para expandir las Transcripciones de Nivel de Palabra a Transcripciones de Nivel de Fonema - es decir, reemplazar cada palabra por sus fonemas y colocar el resultado en un nuevo Archivo de Etiqueta Maestra de Nivel de Fonema. Esto se hace revisando cada palabra del archivo MLF y buscando los fonemas que componen esa palabra en el archivo dict que creó anteriormente, la salida del resultado en un archivo llamado fonemas0.mlf (que no tendrá pausas cortas ("sp"s) después de cada grupo de teléfono de la palabra).

    Primero, crea el script de edición mkfonemas0.led en tu carpeta 'voxforge/tutorial':

      EX
      IS sil sil
      DE sp


      (Nota: recuerde incluir una línea en blanco al final de este guión)

      A continuación, ejecute el siguiente comando HLEd desde la carpeta 'voxforge/tutorial':

      Linux:

        ../soft/htk/HTKTools/HLEd -A -D -T 1 -l '*' -d dict -i fonemas0.mlf mkfonemas0.led palabras.mlf

      Windows:

        C:>HLEd -A -D -T 1 -l * -d dict -i fonemas0.mlf mkfonemas0.led palabras.mlf

      Que crea el archivo fonemas0.mlf

      A continuación, necesitamos crear un segundo archivo fonemas1.mlf (que incluirá pausas cortas ("sp") después de cada grupo de fonemas de palabras). Primero crea el mkfonemas1.led en tu carpeta 'voxforge/tutorial' como sigue:

        EX
        IS sil sil


        (Nota: recuerde incluir una línea en blanco al final de este guión)

      A continuación, ejecute el comando HLEd de nuevo desde su carpeta 'voxforge/tutorial' de la siguiente manera:

      Linux:

        ../soft/htk/HTKTools/HLEd -A -D -T 1 -l '*' -d dict -i fonemas1.mlf mkfonemas1.led palabras.mlf

      Ventanas:

        C:> HLEd -A -D -T 1 -l * -d dict -i fonemas1.mlf mkfonemas1.led palabras.mlf

      Que crea el archivo fonemas1.mlf .