Spaces:

gsarti
/

pecore

Running on Zero

App Files Files Community

gsarti commited on Mar 20, 2024

Commit

449ac0a

1 Parent(s): 08d76ce

Added NLLB preset

Browse files

Files changed (2) hide show

app.py +23 -10
presets.py +10 -1

app.py CHANGED Viewed

@@ -24,7 +24,8 @@ from presets import (
     set_chatml_preset,
     set_cora_preset,
     set_default_preset,
-    set_mmt_preset,
     set_towerinstruct_preset,
     set_zephyr_preset,
     set_gemma_preset,
@@ -242,22 +243,24 @@ with gr.Blocks(css=custom_css) as demo:
                     "Preset for the <a href='https://huggingface.co/gsarti/cora_mgen' target='_blank'>CORA Multilingual QA</a> model.\nUses special templates for inputs."
                 )
             with gr.Column():
-                zephyr_preset = gr.Button("Zephyr Template", variant="secondary", interactive=False)
                 gr.Markdown(
-                    "Preset for models using the <a href='https://huggingface.co/stabilityai/stablelm-2-zephyr-1_6b' target='_blank'>StableLM 2 Zephyr conversational template</a>.\nUses <code><|system|></code>, <code><|user|></code> and <code><|assistant|></code> special tokens."
                 )
         with gr.Row(equal_height=True):
             with gr.Column(scale=1):
-                multilingual_mt_template = gr.Button(
-                    "Multilingual MT", variant="secondary"
                 )
                 gr.Markdown(
-                    "Preset for multilingual MT models such as <a href='https://huggingface.co/facebook/nllb-200-distilled-600M' target='_blank'>NLLB</a> and <a href='https://huggingface.co/facebook/mbart-large-50-many-to-many-mmt' target='_blank'>mBART</a> using language tags."
                 )
             with gr.Column(scale=1):
-                chatml_template = gr.Button("Qwen ChatML", variant="secondary")
                 gr.Markdown(
-                    "Preset for models using the <a href='https://github.com/MicrosoftDocs/azure-docs/blob/main/articles/ai-services/openai/includes/chat-markup-language.md' target='_blank'>ChatML conversational template</a>.\nUses <code><|im_start|></code>, <code><|im_end|></code> special tokens."
                 )
             with gr.Column(scale=1):
                 towerinstruct_template = gr.Button(
@@ -267,6 +270,11 @@ with gr.Blocks(css=custom_css) as demo:
                     "Preset for models using the <a href='https://huggingface.co/Unbabel/TowerInstruct-7B-v0.1' target='_blank'>Unbabel TowerInstruct</a> conversational template.\nUses <code><|im_start|></code>, <code><|im_end|></code> special tokens."
                 )
         with gr.Row(equal_height=True):
             with gr.Column(scale=1):
                 gemma_template = gr.Button(
                     "Gemma Chat Template", variant="secondary", interactive=False
@@ -624,8 +632,13 @@ with gr.Blocks(css=custom_css) as demo:
         ],
     ).success(preload_model, inputs=load_model_args, cancels=load_model_event)
-    multilingual_mt_template.click(**reset_kwargs).then(
-        set_mmt_preset,
         outputs=[model_name_or_path, input_template, output_template, tokenizer_kwargs],
     ).success(preload_model, inputs=load_model_args, cancels=load_model_event)

     set_chatml_preset,
     set_cora_preset,
     set_default_preset,
+    set_mbart_mmt_preset,
+    set_nllb_mmt_preset,
     set_towerinstruct_preset,
     set_zephyr_preset,
     set_gemma_preset,
                     "Preset for the <a href='https://huggingface.co/gsarti/cora_mgen' target='_blank'>CORA Multilingual QA</a> model.\nUses special templates for inputs."
                 )
             with gr.Column():
+                chatml_template = gr.Button("Qwen ChatML", variant="secondary")
                 gr.Markdown(
+                    "Preset for models using the <a href='https://github.com/MicrosoftDocs/azure-docs/blob/main/articles/ai-services/openai/includes/chat-markup-language.md' target='_blank'>ChatML conversational template</a>.\nUses <code><|im_start|></code>, <code><|im_end|></code> special tokens."
                 )
         with gr.Row(equal_height=True):
             with gr.Column(scale=1):
+                mbart_mmt_template = gr.Button(
+                    "mBART Multilingual MT", variant="secondary"
                 )
                 gr.Markdown(
+                    "Preset for the <a href='https://huggingface.co/facebook/mbart-large-50-many-to-many-mmt' target='_blank'>mBART Many-to-Many</a> multilingual MT model using language tags (default: English to French)."
                 )
             with gr.Column(scale=1):
+                nllb_mmt_template = gr.Button(
+                    "NLLB Multilingual MT", variant="secondary"
+                )
                 gr.Markdown(
+                    "Preset for the <a href='https://huggingface.co/facebook/nllb-200-distilled-600M' target='_blank'>NLLB 600M</a> multilingual MT model using language tags (default: English to French)."
                 )
             with gr.Column(scale=1):
                 towerinstruct_template = gr.Button(
                     "Preset for models using the <a href='https://huggingface.co/Unbabel/TowerInstruct-7B-v0.1' target='_blank'>Unbabel TowerInstruct</a> conversational template.\nUses <code><|im_start|></code>, <code><|im_end|></code> special tokens."
                 )
         with gr.Row(equal_height=True):
+            with gr.Column():
+                zephyr_preset = gr.Button("Zephyr Template", variant="secondary", interactive=False)
+                gr.Markdown(
+                    "Preset for models using the <a href='https://huggingface.co/stabilityai/stablelm-2-zephyr-1_6b' target='_blank'>StableLM 2 Zephyr conversational template</a>.\nUses <code><|system|></code>, <code><|user|></code> and <code><|assistant|></code> special tokens."
+                )
             with gr.Column(scale=1):
                 gemma_template = gr.Button(
                     "Gemma Chat Template", variant="secondary", interactive=False
         ],
     ).success(preload_model, inputs=load_model_args, cancels=load_model_event)
+    mbart_mmt_template.click(**reset_kwargs).then(
+        set_mbart_mmt_preset,
+        outputs=[model_name_or_path, input_template, output_template, tokenizer_kwargs],
+    ).success(preload_model, inputs=load_model_args, cancels=load_model_event)
+    nllb_mmt_template.click(**reset_kwargs).then(
+        set_nllb_mmt_preset,
         outputs=[model_name_or_path, input_template, output_template, tokenizer_kwargs],
     ).success(preload_model, inputs=load_model_args, cancels=load_model_event)

presets.py CHANGED Viewed

@@ -46,7 +46,7 @@ def set_chatml_preset():
     )
-def set_mmt_preset():
     return (
         "facebook/mbart-large-50-one-to-many-mmt",  # model_name_or_path
         "{context} {current}",  # input_template
@@ -55,6 +55,15 @@ def set_mmt_preset():
     )
 def set_towerinstruct_preset():
     return (
         "Unbabel/TowerInstruct-7B-v0.1",  # model_name_or_path

     )
+def set_mbart_mmt_preset():
     return (
         "facebook/mbart-large-50-one-to-many-mmt",  # model_name_or_path
         "{context} {current}",  # input_template
     )
+def set_nllb_mmt_preset():
+    return (
+        "facebook/nllb-200-distilled-600M",  # model_name_or_path
+        "{context} {current}",  # input_template
+        "{context} {current}",  # output_template
+        '{\n\t"src_lang": "eng_Latn",\n\t"tgt_lang": "fra_Latn"\n}',  # tokenizer_kwargs
+    )
 def set_towerinstruct_preset():
     return (
         "Unbabel/TowerInstruct-7B-v0.1",  # model_name_or_path