Spaces:

togethercomputer
/

GPT-JT

Runtime error

App Files Files Community

xzyao commited on Nov 27, 2022

Commit

f203ba6

1 Parent(s): e3b7503

Update app.py

Browse files

Files changed (1) hide show

app.py +21 -35

app.py CHANGED Viewed

@@ -1,56 +1,42 @@
 import streamlit as st
 import requests
-import asyncio
 import time
 from ast import literal_eval
-import urllib.parse
-from dacite import from_dict
-from together_web3.computer import LanguageModelInferenceRequest
-from together_web3.together import TogetherWeb3
-st.title("GPT-JT")
-if 'together_web3' not in st.session_state:
-    st.session_state.together_web3 = TogetherWeb3()
-if 'loop' not in st.session_state:
-    st.session_state.loop = asyncio.new_event_loop()
-async def _inference(prompt, max_tokens, stop, top_p, temperature, seed):
-    result = await st.session_state.together_web3.language_model_inference(
-        from_dict(
-            data_class=LanguageModelInferenceRequest,
-            data={
-                "model": "Together-gpt-JT-6B-v1",
-                "max_tokens": max_tokens,
-                "prompt": prompt,
-                "stop": stop,
-                "top_p": top_p,
-                "temperature": temperature,
-                "seed": seed,
-            }
-        ),
-    )
-    return result
 @st.cache
 def infer(prompt,
           model_name,
           max_new_tokens=10,
-          temperature=1.0,
           top_p=1.0,
           num_completions=1,
           seed=42,
           stop="\n"):
-    print("prompt", prompt)
-    stop = stop.split(";")
-    response = st.session_state.loop.run_until_complete(_inference(prompt, int(max_new_tokens), stop, float(top_p), float(temperature), int(seed)))
-    print(response)
-    return response.choices[0].text
 col1, col2 = st.columns([1, 3])
 with col1:
     model_name = st.selectbox("Model", ["GPT-JT-6B-v1"])
     max_new_tokens = st.text_input('Max new tokens', "10")
-    temperature = st.text_input('temperature', "1.0")
     top_p = st.text_input('top_p', "1.0")
     num_completions = st.text_input('num_completions (only the best one will be returend)', "1")
     stop = st.text_input('stop, split by;', r'\n')
@@ -76,4 +62,4 @@ with col2:
             prompt, model_name=model_name, max_new_tokens=max_new_tokens, temperature=temperature, top_p=top_p,
             num_completions=num_completions, seed=seed, stop=literal_eval("'''"+stop+"'''"),
         )
-        generated_area.text(prompt + report_text)

 import streamlit as st
 import requests
 import time
 from ast import literal_eval
 @st.cache
 def infer(prompt,
           model_name,
           max_new_tokens=10,
+          temperature=0.0,
           top_p=1.0,
           num_completions=1,
           seed=42,
           stop="\n"):
+    model_name_map = {
+        "GPT-JT-6B-v1": "Together-gpt-JT-6B-v1",
+    }
+    my_post_dict = {
+        "model": "Together-gpt-JT-6B-v1",
+        "prompt": prompt,
+        "top_p": float(top_p),
+        "temperature": float(temperature),
+        "max_tokens": int(max_new_tokens),
+        "stop": stop.split(";")
+    }
+    response = requests.get("https://staging.together.xyz/api/inference", params=my_post_dict).json()
+    return response['output']['choices'][0]['text']
+st.title("GPT-JT")
 col1, col2 = st.columns([1, 3])
 with col1:
     model_name = st.selectbox("Model", ["GPT-JT-6B-v1"])
     max_new_tokens = st.text_input('Max new tokens', "10")
+    temperature = st.text_input('temperature', "0.0")
     top_p = st.text_input('top_p', "1.0")
     num_completions = st.text_input('num_completions (only the best one will be returend)', "1")
     stop = st.text_input('stop, split by;', r'\n')
             prompt, model_name=model_name, max_new_tokens=max_new_tokens, temperature=temperature, top_p=top_p,
             num_completions=num_completions, seed=seed, stop=literal_eval("'''"+stop+"'''"),
         )
+        generated_area.text(prompt + report_text)