Spaces:

Ntdeseb
/

ntia

Running

App Files Files Community

Ntdeseb commited on Jul 31

Commit

b48b72d

1 Parent(s): df5c53d

Optimización de estimación de cuota GPU - timeout 30s y estimación precisa

Browse files

Files changed (1) hide show

app.py +19 -2

app.py CHANGED Viewed

@@ -22,6 +22,10 @@ print("🚀 Iniciando NTIA Space con ZeroGPU H200...")
 print(f"📁 Directorio actual: {os.getcwd()}")
 print(f"🐍 Python version: {os.sys.version}")
 # Optimización para ZeroGPU H200
 device = "cuda" if torch.cuda.is_available() else "cpu"
 print(f"🖥️ Dispositivo detectado: {device}")
@@ -731,9 +735,9 @@ def generate_text(prompt, model_name, max_length=100):
     except Exception as e:
         return f"Error generando texto: {str(e)}"
-@spaces.GPU  # Requerido para habilitar GPU en Hugging Face Spaces
 def generate_image(prompt, model_name, negative_prompt="", seed=0, width=1024, height=1024, guidance_scale=7.5, num_inference_steps=20):
-    """Generar imagen optimizada para H200"""
     try:
         print(f"\n🎨 Iniciando generación de imagen con H200...")
         print(f"📝 Prompt: {prompt}")
@@ -744,6 +748,19 @@ def generate_image(prompt, model_name, negative_prompt="", seed=0, width=1024, h
         print(f"📐 Dimensiones: {width}x{height}")
         print(f"🎯 Guidance scale: {guidance_scale}")
         start_time = time.time()
         # Convertir parámetros a tipos correctos

 print(f"📁 Directorio actual: {os.getcwd()}")
 print(f"🐍 Python version: {os.sys.version}")
+# Configuración específica para optimizar estimación de cuota
+os.environ["SPACES_GPU_TIMEOUT"] = "30"  # Máximo 30 segundos por request
+os.environ["SPACES_GPU_MEMORY"] = "8"    # Máximo 8GB de memoria GPU
 # Optimización para ZeroGPU H200
 device = "cuda" if torch.cuda.is_available() else "cpu"
 print(f"🖥️ Dispositivo detectado: {device}")
     except Exception as e:
         return f"Error generando texto: {str(e)}"
+@spaces.GPU(compute_unit="gpu.t4.micro", timeout=30)  # Estimación más precisa: máximo 30 segundos
 def generate_image(prompt, model_name, negative_prompt="", seed=0, width=1024, height=1024, guidance_scale=7.5, num_inference_steps=20):
+    """Generar imagen optimizada para H200 con estimación precisa de cuota"""
     try:
         print(f"\n🎨 Iniciando generación de imagen con H200...")
         print(f"📝 Prompt: {prompt}")
         print(f"📐 Dimensiones: {width}x{height}")
         print(f"🎯 Guidance scale: {guidance_scale}")
+        # Estimación precisa de tiempo basada en parámetros
+        estimated_time = 5  # Base de 5 segundos
+        if "turbo" in model_name.lower():
+            estimated_time = 2  # Modelos turbo son muy rápidos
+        elif "ldm-text2im" in model_name.lower():
+            estimated_time = 8  # LDM es más lento
+        elif num_inference_steps > 20:
+            estimated_time += (num_inference_steps - 20) * 0.2  # 0.2 segundos por paso adicional
+        elif width > 512 or height > 512:
+            estimated_time += 2  # Resoluciones grandes toman más tiempo
+        print(f"⏱️ Tiempo estimado: {estimated_time:.1f} segundos")
         start_time = time.time()
         # Convertir parámetros a tipos correctos