Spaces:

helloperson123
/

tiny-llama-chatbot

Sleeping

App Files Files Community

helloperson123 commited on 5 days ago

Commit

19ec13e

verified ·

1 Parent(s): c1a8aec

Update app.py

Browse files

Files changed (1) hide show

app.py +6 -25

app.py CHANGED Viewed

@@ -1,16 +1,12 @@
 from flask import Flask, request, jsonify
 from transformers import AutoTokenizer, AutoModelForCausalLM
 import torch
-import requests
 app = Flask(__name__)
-# Allow CORS for everything (so TurboWarp can connect)
-from flask_cors import CORS
 CORS(app)
-# === Load Phi model ===
-print("🚀 Loading Phi model... this may take a minute.")
 model_name = "microsoft/phi-2"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(
@@ -19,20 +15,18 @@ model = AutoModelForCausalLM.from_pretrained(
     low_cpu_mem_usage=True
 )
 model.to("cuda" if torch.cuda.is_available() else "cpu")
-print("✅ Model loaded!")
-# === Main API ===
 @app.route("/api/ask", methods=["POST"])
 def ask():
-    data = request.get_json()
     prompt = data.get("prompt", "")
     chat_prompt = f"### Instruction:\nYou are Acla, a helpful AI powered by phi-3 mini that can reason about math, code, and logic.\n\n### Input:\n{prompt}\n\n### Response:"
     inputs = tokenizer(chat_prompt, return_tensors="pt").to(model.device)
     outputs = model.generate(
         **inputs,
-        max_new_tokens=300,
         temperature=0.7,
         top_p=0.9,
         do_sample=True
@@ -42,22 +36,9 @@ def ask():
     response = text.split("### Response:")[-1].strip()
     return jsonify({"reply": response})
-# === Proxy endpoint ===
-@app.route("/proxy", methods=["POST"])
-def proxy():
-    """Forward TurboWarp requests to /api/ask internally."""
-    try:
-        data = request.get_json()
-        r = requests.post("http://localhost:7860/api/ask", json=data)
-        return jsonify(r.json())
-    except Exception as e:
-        return jsonify({"error": str(e)}), 500
 @app.route("/")
 def home():
-    return "🧠 Phi-2 Chatbot + Proxy running! Send POST to /proxy or /api/ask"
 if __name__ == "__main__":
     app.run(host="0.0.0.0", port=7860)

 from flask import Flask, request, jsonify
 from transformers import AutoTokenizer, AutoModelForCausalLM
+from flask_cors import CORS
 import torch
 app = Flask(__name__)
 CORS(app)
+print("🚀 Loading Phi model (microsoft/phi-2)...")
 model_name = "microsoft/phi-2"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(
     low_cpu_mem_usage=True
 )
 model.to("cuda" if torch.cuda.is_available() else "cpu")
+print("✅ Phi model loaded!")
 @app.route("/api/ask", methods=["POST"])
 def ask():
+    data = request.get_json(force=True)
     prompt = data.get("prompt", "")
     chat_prompt = f"### Instruction:\nYou are Acla, a helpful AI powered by phi-3 mini that can reason about math, code, and logic.\n\n### Input:\n{prompt}\n\n### Response:"
     inputs = tokenizer(chat_prompt, return_tensors="pt").to(model.device)
     outputs = model.generate(
         **inputs,
+        max_new_tokens=250,
         temperature=0.7,
         top_p=0.9,
         do_sample=True
     response = text.split("### Response:")[-1].strip()
     return jsonify({"reply": response})
 @app.route("/")
 def home():
+    return "🧠 Phi-2 chatbot is running! POST JSON to /api/ask with {'prompt': 'your question'}."
 if __name__ == "__main__":
     app.run(host="0.0.0.0", port=7860)