Spaces:

BounharAbdelaziz
/

Al-Atlas-LLM

Running

App Files Files Community

BounharAbdelaziz commited on Feb 26

Commit

309169c

verified ·

1 Parent(s): 5756e92

Explicit set eos and pad token

Browse files

Files changed (1) hide show

app.py +12 -6

app.py CHANGED Viewed

@@ -9,11 +9,15 @@ device = "cuda:0" if torch.cuda.is_available() else "cpu"
 print(f'[INFO] Using device: {device}')
 # Load the pretrained model and tokenizer
-MODEL_NAME = "BounharAbdelaziz/Al-Atlas-LLM-0.5B"
-tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
 model = AutoModelForCausalLM.from_pretrained(MODEL_NAME).to(device)
 # Predefined examples
 examples = [
     ["الذكاء الاصطناعي هو فرع من علوم الكمبيوتر اللي كيركز"
@@ -39,6 +43,8 @@ def generate_text(prompt, max_length=256, temperature=0.7, top_p=0.9, top_k=150,
         num_beams=num_beams,
         top_k= top_k,
         early_stopping = True,
     )
     return tokenizer.decode(output[0], skip_special_tokens=True)
@@ -49,9 +55,9 @@ if __name__ == "__main__":
             fn=generate_text,
             inputs=[
                 gr.Textbox(label="Prompt: دخل النص بالدارجة"),
-                gr.Slider(50, 4096, value=256, label="Max Length"),
-                gr.Slider(0.1, 1.5, value=0.7, label="Temperature"),
-                gr.Slider(0.1, 1.0, value=0.9, label="Top-p"),
                 gr.Slider(1, 10000, value=150, label="Top-k"),
                 gr.Slider(1, 20, value=8, label="Number of Beams"),
                 gr.Slider(0.0, 100.0, value=1.5, label="Repetition Penalty"),
@@ -62,4 +68,4 @@ if __name__ == "__main__":
             examples=examples,
         )
-    app.launch()

 print(f'[INFO] Using device: {device}')
 # Load the pretrained model and tokenizer
+MODEL_NAME = "BounharAbdelaziz/Al-Atlas-LLM-0.5B" # "atlasia/Al-Atlas-LLM-mid-training" # "BounharAbdelaziz/Al-Atlas-LLM-0.5B" #"atlasia/Al-Atlas-LLM"
+tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME) # , token=token
 model = AutoModelForCausalLM.from_pretrained(MODEL_NAME).to(device)
+# Fix tokenizer padding
+if tokenizer.pad_token is None:
+    tokenizer.pad_token = tokenizer.eos_token  # Set pad token
 # Predefined examples
 examples = [
     ["الذكاء الاصطناعي هو فرع من علوم الكمبيوتر اللي كيركز"
         num_beams=num_beams,
         top_k= top_k,
         early_stopping = True,
+        pad_token_id=tokenizer.pad_token_id,  # Explicit pad token
+        eos_token_id=tokenizer.eos_token_id,  # Explicit eos token
     )
     return tokenizer.decode(output[0], skip_special_tokens=True)
             fn=generate_text,
             inputs=[
                 gr.Textbox(label="Prompt: دخل النص بالدارجة"),
+                gr.Slider(8, 4096, value=256, label="Max Length"),
+                gr.Slider(0.0, 2, value=0.7, label="Temperature"),
+                gr.Slider(0.0, 1.0, value=0.9, label="Top-p"),
                 gr.Slider(1, 10000, value=150, label="Top-k"),
                 gr.Slider(1, 20, value=8, label="Number of Beams"),
                 gr.Slider(0.0, 100.0, value=1.5, label="Repetition Penalty"),
             examples=examples,
         )
+    app.launch()