Spaces:

Ticio
/

TicioProd

Sleeping

App Files Files Community

TicioProd / inference.py

Ticio

Upload 2 files

fb073ad verified 4 months ago

raw

history blame

5.12 kB

	import vecs
	from dotenv import load_dotenv
	import os
	import threading
	import base64
	import os
	from google import genai
	from google.genai import types
	from sentence_transformers.SentenceTransformer import SentenceTransformer

	load_dotenv()

	user = os.getenv("user")
	password = os.getenv("password")
	host = os.getenv("host")
	port = os.getenv("port")
	db_name = "postgres"
	DB_CONNECTION = f"postgresql://{user}:{password}@{host}:{port}/{db_name}"
	vx = vecs.create_client(DB_CONNECTION)
	model = SentenceTransformer('Snowflake/snowflake-arctic-embed-xs', device="cpu")
	client = genai.Client(api_key=os.getenv('GEMINI_API_KEY'))

	def query_db(query, limit = 5, filters = {}, measure = "cosine_distance", include_value = True, include_metadata=True, table = "2023"):
	query_embeds = vx.get_or_create_collection(name= table, dimension=384)
	ans = query_embeds.query(
	data=query,
	limit=limit,
	filters=filters,
	measure=measure,
	include_value=include_value,
	include_metadata=include_metadata,
	)
	return ans

	def sort_by_score(item):
	return item[1]

	def infaño(rad):
	a = int(rad[len(rad)-2::])
	if a > 89:
	return a + 1900
	else:
	return a + 2000

	def thread_query(query, target, year):
	return target.extend(query_db(query, table=str(year)))


	def vector_query(query, start = 1992, end = 2024):
	results = []
	vector_query = model.encode(query)
	threads = []
	for i in range(start, end + 1):
	t = threading.Thread(target=thread_query, args=(vector_query, results, i))
	threads.append(t)
	t.start()
	threads[-1].join()
	results.sort(key=sort_by_score)
	q = {}
	for i in results:
	if i[2]['sentencia'] not in q.keys():
	q[i[2]['sentencia']] = 1
	else:
	q[i[2]['sentencia']] += 1
	judgements = []

	for i in q.keys():
	if q[i] > 1:
	judgements.append(i)
	print(query, judgements)
	return judgements

	def context_builder_prompt_constructor(judgement):
	return judgement

	def context_builder(context_prompt, target):
	model = "gemini-2.5-flash-lite"
	contents = [
	types.Content(
	role="user",
	parts=[
	types.Part.from_text(text=context_prompt),
	],
	),
	]
	tools = [
	types.Tool(googleSearch=types.GoogleSearch(
	)),]
	generate_content_config = types.GenerateContentConfig(
	thinking_config = types.ThinkingConfig(
	thinking_budget=0,
	),
	tools=tools,
	system_instruction=[
	types.Part.from_text(text=f"""resume el contenido de la sentencia de forma detallada, mencionando todos los puntos considerados en la sentencia"""),
	],
	)

	response = client.models.generate_content(
	model=model,
	contents=contents,
	config=generate_content_config,
	)
	return target.append(response.text)

	def context_draft(judgements, query):
	context = []
	threads = []
	for i in judgements:
	t = threading.Thread(target=context_builder, args=(context_builder_prompt_constructor(i), context))
	threads.append(t)
	t.start()

	while len(context) < len(threads):
	pass

	draft = ''
	for i in context:
	draft += i + '\n'
	return draft

	def generate(query, context, message_history):
	model = "gemini-2.5-flash-lite"

	# Convert Hugging Face style message history to Gemini API format
	gemini_contents = []
	for message in message_history:
	role = "user" if message["role"] == "user" else "model"
	gemini_contents.append(
	types.Content(
	role=role,
	parts=[types.Part.from_text(text=message["content"])],
	)
	)

	# Add the current user query to the contents
	gemini_contents.append(
	types.Content(
	role="user",
	parts=[
	types.Part.from_text(text=query),
	],
	)
	)


	generate_content_config = types.GenerateContentConfig(
	thinking_config = types.ThinkingConfig(
	thinking_budget=0,
	),
	system_instruction=[
	types.Part.from_text(text=f"""Eres Ticio un asistente de investigación de jurisprudencia colombiana. Tienes acceso a un contexto especialmente diseñado para esta conversación. Tu tarea es contestar a las preguntas del usuario referenciando siempre las sentencias de donde viene la información como si fueras un investigador experto.
	{context}

	""")]
	)

	response = client.models.generate_content(
	model=model,
	contents=gemini_contents,
	config=generate_content_config,
	)
	return response.text

	def inference(query, history, context):
	if context == None or len(context) <= 0 or len(history) <= 0:
	vector_query_results = vector_query(query)
	context = context_draft(vector_query_results, query)
	return generate(query, context, history), context
	else:
	return generate(query, context, history), context