Spaces:

Ticio
/

TicioProd

Running

App Files Files Community

Ticio commited on Aug 30

Commit

13769af

verified ·

1 Parent(s): 55b1ed1

Update inference.py

Browse files

Files changed (1) hide show

inference.py +197 -170

inference.py CHANGED Viewed

@@ -1,171 +1,198 @@
-import vecs
-from dotenv import load_dotenv
-import os
-import threading
-import base64
-import os
-from google import genai
-from google.genai import types
-from sentence_transformers.SentenceTransformer import SentenceTransformer
-load_dotenv()
-user = os.getenv("user")
-password = os.getenv("password")
-host = os.getenv("host")
-port = os.getenv("port")
-db_name = "postgres"
-DB_CONNECTION = f"postgresql://{user}:{password}@{host}:{port}/{db_name}"
-vx = vecs.create_client(DB_CONNECTION)
-model = SentenceTransformer('Snowflake/snowflake-arctic-embed-xs', device="cpu")
-client = genai.Client(api_key=os.getenv('GEMINI_API_KEY'))
-def query_db(query, limit = 5, filters = {}, measure = "cosine_distance", include_value = True, include_metadata=True, table = "2023"):
-  query_embeds = vx.get_or_create_collection(name= table, dimension=384)
-  ans = query_embeds.query(
-      data=query,
-      limit=limit,
-      filters=filters,
-      measure=measure,
-      include_value=include_value,
-      include_metadata=include_metadata,
-  )
-  return ans
-def sort_by_score(item):
-  return item[1]
-def infaño(rad):
-  a = int(rad[len(rad)-2::])
-  if  a > 89:
-    return a + 1900
-  else:
-    return a + 2000
-def thread_query(query, target, year):
-  return target.extend(query_db(query, table=str(year)))
-def vector_query(query, start = 1992, end = 2024):
-  results = []
-  vector_query = model.encode(query)
-  threads = []
-  for i in range(start, end + 1):
-    t = threading.Thread(target=thread_query, args=(vector_query, results, i))
-    threads.append(t)
-    t.start()
-  threads[-1].join()
-  results.sort(key=sort_by_score)
-  q = {}
-  for i in results:
-    if i[2]['sentencia'] not in q.keys():
-      q[i[2]['sentencia']] = 1
-    else:
-      q[i[2]['sentencia']] += 1
-  judgements = []
-  for i in q.keys():
-    if q[i] > 1:
-      judgements.append(i)
-  print(query, judgements)
-  return judgements
-def context_builder_prompt_constructor(judgement):
-    return judgement
-def context_builder(context_prompt, target):
-    model = "gemini-2.5-flash-lite"
-    contents = [
-        types.Content(
-            role="user",
-            parts=[
-                types.Part.from_text(text=context_prompt),
-            ],
-        ),
-    ]
-    tools = [
-        types.Tool(googleSearch=types.GoogleSearch(
-        )),]
-    generate_content_config = types.GenerateContentConfig(
-        thinking_config = types.ThinkingConfig(
-            thinking_budget=0,
-        ),
-        tools=tools,
-        system_instruction=[
-            types.Part.from_text(text=f"""resume el contenido de la sentencia de forma detallada, mencionando todos los puntos considerados en la sentencia"""),
-        ],
-    )
-    response = client.models.generate_content(
-        model=model,
-        contents=contents,
-        config=generate_content_config,
-    )
-    return target.append(response.text)
-def context_draft(judgements, query):
-  context = []
-  threads = []
-  for i in judgements:
-    t = threading.Thread(target=context_builder, args=(context_builder_prompt_constructor(i), context))
-    threads.append(t)
-    t.start()
-  while len(context) < len(threads):
-    pass
-  draft = ''
-  for i in context:
-    draft += i + '\n'
-  return draft
-def generate(query, context, message_history):
-    model = "gemini-2.5-flash-lite"
-    # Convert Hugging Face style message history to Gemini API format
-    gemini_contents = []
-    for message in message_history:
-        role = "user" if message["role"] == "user" else "model"
-        gemini_contents.append(
-            types.Content(
-                role=role,
-                parts=[types.Part.from_text(text=message["content"])],
-            )
-        )
-    # Add the current user query to the contents
-    gemini_contents.append(
-        types.Content(
-            role="user",
-            parts=[
-                types.Part.from_text(text=query),
-            ],
-        )
-    )
-    generate_content_config = types.GenerateContentConfig(
-        thinking_config = types.ThinkingConfig(
-            thinking_budget=0,
-        ),
-        system_instruction=[
-            types.Part.from_text(text=f"""Eres Ticio un asistente de investigación de jurisprudencia colombiana. Tienes acceso a un contexto especialmente diseñado para esta conversación. Tu tarea es contestar a las preguntas del usuario referenciando siempre las sentencias de donde viene la información como si fueras un investigador experto.
-{context}
-""")]
-    )
-    response = client.models.generate_content(
-        model=model,
-        contents=gemini_contents,
-        config=generate_content_config,
-    )
-    return response.text
-def inference(query, history, context):
-  if context == None or len(context) <= 0 or len(history) <= 0:
-    vector_query_results = vector_query(query)
-    context = context_draft(vector_query_results, query)
-    return generate(query, context, history), context
-  else:
     return generate(query, context, history), context

+import vecs
+from dotenv import load_dotenv
+import os
+import threading
+import base64
+import os
+import threading
+from google import genai
+from google.genai import types
+from sentence_transformers.SentenceTransformer import SentenceTransformer
+import smtplib, ssl
+from email.mime.text import MIMEText
+load_dotenv()
+user = os.getenv("user")
+password = os.getenv("password")
+host = os.getenv("host")
+port = os.getenv("port")
+mail = os.getenv("email")
+APP_PASSWORD = os.getenv("app_password")
+db_name = "postgres"
+DB_CONNECTION = f"postgresql://{user}:{password}@{host}:{port}/{db_name}"
+vx = vecs.create_client(DB_CONNECTION)
+model = SentenceTransformer('Snowflake/snowflake-arctic-embed-xs', device="cpu")
+client = genai.Client(api_key=os.getenv('GEMINI_API_KEY'))
+def feedback(query, context, history):
+    msg = MIMEText(f"""Hola, envío automático con SMTP.
+    query: {query}
+    context: {context}
+    history: {history}
+                   """, "plain", "utf-8")
+    msg["Subject"] = "feedback"
+    msg["From"] = mail
+    msg["To"] = mail
+    try:
+        with smtplib.SMTP_SSL("smtp.gmail.com", 465, context=ssl.create_default_context()) as server:
+            server.login(mail, APP_PASSWORD)
+            server.send_message(msg)
+    except:
+       print(f'envio fallido {query}')
+def query_db(query, limit = 5, filters = {}, measure = "cosine_distance", include_value = True, include_metadata=True, table = "2023"):
+  query_embeds = vx.get_or_create_collection(name= table, dimension=384)
+  ans = query_embeds.query(
+      data=query,
+      limit=limit,
+      filters=filters,
+      measure=measure,
+      include_value=include_value,
+      include_metadata=include_metadata,
+  )
+  return ans
+def sort_by_score(item):
+  return item[1]
+def infaño(rad):
+  a = int(rad[len(rad)-2::])
+  if  a > 89:
+    return a + 1900
+  else:
+    return a + 2000
+def thread_query(query, target, year):
+  return target.extend(query_db(query, table=str(year)))
+def vector_query(query, start = 1992, end = 2024):
+  results = []
+  vector_query = model.encode(query)
+  threads = []
+  for i in range(start, end + 1):
+    t = threading.Thread(target=thread_query, args=(vector_query, results, i))
+    threads.append(t)
+    t.start()
+  threads[-1].join()
+  results.sort(key=sort_by_score)
+  q = {}
+  for i in results:
+    if i[2]['sentencia'] not in q.keys():
+      q[i[2]['sentencia']] = 1
+    else:
+      q[i[2]['sentencia']] += 1
+  judgements = []
+  for i in q.keys():
+    if q[i] > 1:
+      judgements.append(i)
+  print(query, judgements)
+  return judgements
+def context_builder_prompt_constructor(judgement):
+    return judgement
+def context_builder(context_prompt, target):
+    model = "gemini-2.5-flash-lite"
+    contents = [
+        types.Content(
+            role="user",
+            parts=[
+                types.Part.from_text(text=context_prompt),
+            ],
+        ),
+    ]
+    tools = [
+        types.Tool(googleSearch=types.GoogleSearch(
+        )),]
+    generate_content_config = types.GenerateContentConfig(
+        thinking_config = types.ThinkingConfig(
+            thinking_budget=0,
+        ),
+        tools=tools,
+        system_instruction=[
+            types.Part.from_text(text=f"""resume el contenido de la sentencia de forma detallada, mencionando todos los puntos considerados en la sentencia"""),
+        ],
+    )
+    response = client.models.generate_content(
+        model=model,
+        contents=contents,
+        config=generate_content_config,
+    )
+    return target.append(response.text)
+def context_draft(judgements, query):
+  context = []
+  threads = []
+  for i in judgements:
+    t = threading.Thread(target=context_builder, args=(context_builder_prompt_constructor(i), context))
+    threads.append(t)
+    t.start()
+  while len(context) < len(threads):
+    pass
+  draft = ''
+  for i in context:
+    draft += i + '\n'
+  return draft
+def generate(query, context, message_history):
+    model = "gemini-2.5-flash-lite"
+    # Convert Hugging Face style message history to Gemini API format
+    gemini_contents = []
+    for message in message_history:
+        role = "user" if message["role"] == "user" else "model"
+        gemini_contents.append(
+            types.Content(
+                role=role,
+                parts=[types.Part.from_text(text=message["content"])],
+            )
+        )
+    # Add the current user query to the contents
+    gemini_contents.append(
+        types.Content(
+            role="user",
+            parts=[
+                types.Part.from_text(text=query),
+            ],
+        )
+    )
+    generate_content_config = types.GenerateContentConfig(
+        thinking_config = types.ThinkingConfig(
+            thinking_budget=0,
+        ),
+        system_instruction=[
+            types.Part.from_text(text=f"""Eres Ticio un asistente de investigación de jurisprudencia colombiana. Tienes acceso a un contexto especialmente diseñado para esta conversación. Tu tarea es contestar a las preguntas del usuario referenciando siempre las sentencias de donde viene la información como si fueras un investigador experto.
+{context}
+""")]
+    )
+    response = client.models.generate_content(
+        model=model,
+        contents=gemini_contents,
+        config=generate_content_config,
+    )
+    return response.text
+def inference(query, history, context):
+  if context == None or len(context) <= 0 or len(history) <= 0:
+    vector_query_results = vector_query(query)
+    context = context_draft(vector_query_results, query)
+    t = threading.Thread(target=feedback, args=(query, context, history))
+    t.start()
+    return generate(query, context, history), context
+  else:
     return generate(query, context, history), context