Alexa-NLU-Clone

Sleeping

qanastek commited on May 21, 2022

Commit

535f2ec

1 Parent(s): cef12c2

Update

Files changed (6) hide show

app.py CHANGED Viewed

@@ -10,7 +10,7 @@ SAMPLE_RATE = 16_000
 models = {}
-models_names = {
     "en-US": "jonatasgrosman/wav2vec2-large-xlsr-53-english",
     "fr-FR": "jonatasgrosman/wav2vec2-large-xlsr-53-french",
     "nl-NL": "jonatasgrosman/wav2vec2-large-xlsr-53-dutch",
@@ -56,8 +56,8 @@ def transcribe(audio_path, lang_code):
     if lang_code not in models:
         models[lang_code] = {}
-        models[lang_code]["processor"] = Wav2Vec2Processor.from_pretrained(models_names[lang_code])
-        models[lang_code]["model"] = Wav2Vec2ForCTC.from_pretrained(models_names[lang_code])
     # Load model
     processor_asr = models[lang_code]["processor"]
@@ -114,7 +114,7 @@ iface = gr.Interface(
     description='Upload your wav file to test the models',
     inputs=[
         gr.inputs.Audio(label='wav file', source='microphone', type='filepath'),
-        gr.inputs.Dropdown(choices=list(models_names.keys())),
     ],
     outputs=[
         gr.outputs.JSON(label='Slot Recognition + Intent Classification + Language Classification + ASR'),

 models = {}
+models_paths = {
     "en-US": "jonatasgrosman/wav2vec2-large-xlsr-53-english",
     "fr-FR": "jonatasgrosman/wav2vec2-large-xlsr-53-french",
     "nl-NL": "jonatasgrosman/wav2vec2-large-xlsr-53-dutch",
     if lang_code not in models:
         models[lang_code] = {}
+        models[lang_code]["processor"] = Wav2Vec2Processor.from_pretrained(models_paths[lang_code])
+        models[lang_code]["model"] = Wav2Vec2ForCTC.from_pretrained(models_paths[lang_code])
     # Load model
     processor_asr = models[lang_code]["processor"]
     description='Upload your wav file to test the models',
     inputs=[
         gr.inputs.Audio(label='wav file', source='microphone', type='filepath'),
+        gr.inputs.Dropdown(choices=list(models_paths.keys())),
     ],
     outputs=[
         gr.outputs.JSON(label='Slot Recognition + Intent Classification + Language Classification + ASR'),

wavs/{en_US=order-me-a-pizza.wav → en-US=order-me-a-pizza.wav} RENAMED Viewed

File without changes

wavs/{en_US=set-the-volume-to-low.wav → en-US=set-the-volume-to-low.wav} RENAMED Viewed

File without changes

wavs/{en_US=tell-me-a-good-joke.wav → en-US=tell-me-a-good-joke.wav} RENAMED Viewed

File without changes

wavs/{en_US=tell-me-the-artist-of-this-song.wav → en-US=tell-me-the-artist-of-this-song.wav} RENAMED Viewed

File without changes

wavs/{es_ES=poner-una-alarma-a-las-doce.wav → es-ES=poner-una-alarma-a-las-doce.wav} RENAMED Viewed

File without changes