Spaces:

Cudd1es
/

Dr-Bang

Running

Cudd1es commited on 3 days ago

Commit

7405997

verified ·

1 Parent(s): 445d9bd

switched to QWEN

my openai api key was spent 1m tokens by someone yesterday
it made me broken

Files changed (1) hide show

app.py CHANGED Viewed

@@ -10,14 +10,14 @@ from sentence_transformers import CrossEncoder
 QWEN_MODEL="qwen/qwen3-235b-a22b:free"
 DEEPSEEK_MODEL="deepseek/deepseek-chat-v3.1:free"
 GPT_OSS_MODEL="openai/gpt-oss-20b:free"
-#api_key = os.getenv("OPENROUTER_API_KEY")
 #deepseek_key = os.getenv("DEEPSEEK_API_KEY")
-#client = OpenAI(base_url="https://openrouter.ai/api/v1", api_key=api_key)
 # open ai method
-api_key = os.getenv("OPENAI_API_KEY")
-client = OpenAI(api_key=api_key)
-GPT_MODEL="gpt-4o"
@@ -25,7 +25,7 @@ collection = load_collection()
 encoder = load_encoder()
 reranker = CrossEncoder("BAAI/bge-reranker-large")
-def reformulate_query(user_question, model_name=GPT_MODEL):
     prompt = f"""你是一个BangDream知识检索助手。请把用户的问题扩写或转写为适合知识库语义检索的检索语句，涵盖所有可能的提问方式或同义关键词。
     用户问题：{user_question}
     """
@@ -102,7 +102,7 @@ def respond(
     response = ""
     stream = client.chat.completions.create(
-        model=GPT_MODEL,
         messages=messages,
         temperature=temperature,
         max_tokens=max_tokens,

 QWEN_MODEL="qwen/qwen3-235b-a22b:free"
 DEEPSEEK_MODEL="deepseek/deepseek-chat-v3.1:free"
 GPT_OSS_MODEL="openai/gpt-oss-20b:free"
+api_key = os.getenv("OPENROUTER_API_KEY")
 #deepseek_key = os.getenv("DEEPSEEK_API_KEY")
+client = OpenAI(base_url="https://openrouter.ai/api/v1", api_key=api_key)
 # open ai method
+#api_key = os.getenv("OPENAI_API_KEY")
+#client = OpenAI(api_key=api_key)
+#GPT_MODEL="gpt-4o"
 encoder = load_encoder()
 reranker = CrossEncoder("BAAI/bge-reranker-large")
+def reformulate_query(user_question, model_name=QWEN_MODEL):
     prompt = f"""你是一个BangDream知识检索助手。请把用户的问题扩写或转写为适合知识库语义检索的检索语句，涵盖所有可能的提问方式或同义关键词。
     用户问题：{user_question}
     """
     response = ""
     stream = client.chat.completions.create(
+        model=QWEN_MODEL,
         messages=messages,
         temperature=temperature,
         max_tokens=max_tokens,