NewJapaneseLLM

Sleeping

aixsatoshi commited on Jun 22, 2024

Commit

ef2eb9e

verified ·

1 Parent(s): 33e87c8

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -42,10 +42,6 @@ model = AutoModelForCausalLM.from_pretrained(
           device_map="auto",
         )
 tokenizer = AutoTokenizer.from_pretrained(MODELS)
-terminators = [
-    tokenizer.eos_token_id,
-    tokenizer.convert_tokens_to_ids("<|eot_id|>")
-]
 @spaces.GPU
 def stream_chat(message: str, history: list, temperature: float, max_new_tokens: int, top_p: float, top_k: int, penalty: float):
@@ -72,7 +68,7 @@ def stream_chat(message: str, history: list, temperature: float, max_new_tokens:
         max_new_tokens=max_new_tokens,
         do_sample=True,
         temperature=temperature,
-        #eos_token_id = [151645, 151643],
     )
     thread = Thread(target=model.generate, kwargs=generate_kwargs)
@@ -109,7 +105,7 @@ with gr.Blocks(css=CSS) as demo:
                 minimum=128,
                 maximum=4096,
                 step=1,
-                value=256,
                 label="Max new tokens",
                 render=False,
             ),

           device_map="auto",
         )
 tokenizer = AutoTokenizer.from_pretrained(MODELS)
 @spaces.GPU
 def stream_chat(message: str, history: list, temperature: float, max_new_tokens: int, top_p: float, top_k: int, penalty: float):
         max_new_tokens=max_new_tokens,
         do_sample=True,
         temperature=temperature,
+        eos_token_id = [128001, 128009],
     )
     thread = Thread(target=model.generate, kwargs=generate_kwargs)
                 minimum=128,
                 maximum=4096,
                 step=1,
+                value=1024,
                 label="Max new tokens",
                 render=False,
             ),