Spaces:

Xylor
/

gradio_deepseek_001

Sleeping

App Files Files Community

Xylor commited on Apr 28

Commit

3f83509

verified ·

1 Parent(s): 947552f

Add stream kwarg; add dict history support

Browse files

Files changed (1) hide show

app.py +33 -20

app.py CHANGED Viewed

@@ -14,31 +14,43 @@ def respond(
     max_tokens,
     temperature,
     top_p,
 ):
-    messages = [{"role": "system", "content": system_message}]
     for val in history:
-        if val[0]:
-            messages.append({"role": "user", "content": val[0]})
-        if val[1]:
-            messages.append({"role": "assistant", "content": val[1]})
     messages.append({"role": "user", "content": message})
     response = ""
-    for message in client.chat_completion(
-        messages,
-        max_tokens=max_tokens,
-        stream=True,
-        temperature=temperature,
-        top_p=top_p,
-    ):
-        token = message.choices[0].delta.content
-        response += token
-        yield response
 """
 For information on how to customize the ChatInterface, peruse the gradio docs: https://www.gradio.app/docs/chatinterface
@@ -56,6 +68,7 @@ demo = gr.ChatInterface(
             step=0.05,
             label="Top-p (nucleus sampling)",
         ),
     ],
 )

     max_tokens,
     temperature,
     top_p,
+    stream: bool = True,
 ):
+    messages = []
+    if system_message:
+        messages.append({"role": "system", "content": system_message})
     for val in history:
+        if isinstance(val, dict) and "role" in val and "content" in val:
+            messages.append(val)
+        elif isinstance(val, (tuple, list)):
+            messages.append(
+                {"role": "user", "content": val[0]}
+                if val[0] else
+                {"role": "assistant", "content": val[1]}
+            )
     messages.append({"role": "user", "content": message})
     response = ""
+    if stream:
+        for message in client.chat_completion(
+            messages,
+            max_tokens=max_tokens,
+            stream=True,
+            temperature=temperature,
+            top_p=top_p,
+        ):
+            token = message.choices[0].delta.content
+            response += token
+            yield response
+    else:
+        completion = client.chat_completion(
+            messages,
+            max_tokens=max_tokens,
+            temperature=temperature,
+            top_p=top_p,
+        )
+        return completion.choices[0].message
 """
 For information on how to customize the ChatInterface, peruse the gradio docs: https://www.gradio.app/docs/chatinterface
             step=0.05,
             label="Top-p (nucleus sampling)",
         ),
+        gr.Checkbox(value=True, label="Streaming", info="Streaming response vs full completion"),
     ],
 )