Spaces:

Programmes
/

E_P

Sleeping

App Files Files Community

Programmes commited on Mar 25

Commit

87392ed

verified ·

1 Parent(s): 4b4260f

Update rag_utils.py

Browse files

Files changed (1) hide show

rag_utils.py +26 -11

rag_utils.py CHANGED Viewed

@@ -1,10 +1,11 @@
 import faiss
 import pickle
-from sentence_transformers import SentenceTransformer
-from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
-import torch
 import numpy as np
 def load_faiss_index(index_path="faiss_index/faiss_index.faiss", doc_path="faiss_index/documents.pkl"):
     index = faiss.read_index(index_path)
@@ -13,19 +14,33 @@ def load_faiss_index(index_path="faiss_index/faiss_index.faiss", doc_path="faiss
     return index, documents
 def get_embedding_model():
-    return SentenceTransformer("all-MiniLM-L6-v2")
 def query_index(question, index, documents, model, k=3):
     question_embedding = model.encode([question])
     _, indices = index.search(np.array(question_embedding).astype("float32"), k)
-    results = [documents[i] for i in indices[0]]
-    return results
 def generate_answer(question, context):
-    model_id = "mistralai/Mistral-7B-Instruct-v0.1"
-    tokenizer = AutoTokenizer.from_pretrained(model_id, trust_remote_code=True)
-    model = AutoModelForCausalLM.from_pretrained(model_id, device_map="auto", torch_dtype=torch.float16)
     prompt = f"Voici un contexte :\n{context}\n\nQuestion : {question}\nRéponse :"
-    inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
-    outputs = model.generate(**inputs, max_new_tokens=256)
     return tokenizer.decode(outputs[0], skip_special_tokens=True)

+import os
 import faiss
 import pickle
 import numpy as np
+import torch
+from sentence_transformers import SentenceTransformer
+from transformers import AutoModelForCausalLM, AutoTokenizer
 def load_faiss_index(index_path="faiss_index/faiss_index.faiss", doc_path="faiss_index/documents.pkl"):
     index = faiss.read_index(index_path)
     return index, documents
 def get_embedding_model():
+    # Pas besoin de token ici, modèle public
+    print("✅ Chargement de l'encodeur multi-qa-MiniLM-L6-cos-v1")
+    return SentenceTransformer("sentence-transformers/multi-qa-MiniLM-L6-cos-v1")
 def query_index(question, index, documents, model, k=3):
     question_embedding = model.encode([question])
     _, indices = index.search(np.array(question_embedding).astype("float32"), k)
+    return [documents[i] for i in indices[0]]
 def generate_answer(question, context):
+    token = os.getenv("HUGGINGFACE")  # requis pour Mistral
+    model_id = "mgoogle/flan-t5-base"
+    tokenizer = AutoTokenizer.from_pretrained(model_id, token=token)
+    tokenizer.pad_token = tokenizer.eos_token
+    model = AutoModelForCausalLM.from_pretrained(
+        model_id,
+        token=token,
+        device_map="auto",
+        torch_dtype=torch.float16
+    )
     prompt = f"Voici un contexte :\n{context}\n\nQuestion : {question}\nRéponse :"
+    inputs = tokenizer(prompt, return_tensors="pt", padding=True, truncation=True).to(model.device)
+    outputs = model.generate(**inputs, max_new_tokens=256, pad_token_id=tokenizer.eos_token_id)
+    print("🔍 Contexte utilisé pour la génération :")
+    print(context[:500])
     return tokenizer.decode(outputs[0], skip_special_tokens=True)