Spaces:

cavargas10
/

Step1X-TextureGeneration

Runtime error

App Files Files Community

cavargas10 commited on Aug 9

Commit

f5567d8

verified ·

1 Parent(s): fcdb260

Update app.py

Browse files

Files changed (1) hide show

app.py +225 -254

app.py CHANGED Viewed

@@ -1,159 +1,146 @@
-# app.py
-# Fusion: Texto -> Imagen -> Geometría -> Textura
-# Requisitos (resumido):
-# - diffusers / FluxPipeline o el pipeline que uses para generar la imagen
-# - step1x3d_geometry y step1x3d_texture (pipelines que ya usabas)
-# - trellis si lo usas (opcional)
-# Ajusta nombres de modelos, tokens y paths según tu entorno.
 import os
-import uuid
 import logging
-import shutil
-from typing import Tuple, Union
 import gradio as gr
 from PIL import Image
-import numpy as np
-import torch
-import imageio
-# Si tienes decoradores de spaces definidos (como spaces.GPU), impórtalos.
-# from spaces import GPU  # si usas spaces.GPU
-import spaces  # si lo necesitas por compatibilidad con tus decoradores
-# Importa tus pipelines Step1X (o los que uses)
 from step1x3d_geometry.models.pipelines.pipeline import Step1X3DGeometryPipeline
-from step1x3d_texture.pipelines.step1x_3d_texture_synthesis_pipeline import (
-    Step1X3DTexturePipeline,
-)
 from step1x3d_geometry.models.pipelines.pipeline_utils import reduce_face, remove_degenerate_face
-# Si usas FluxPipeline/FluxTransformer como en tu ejemplo:
-from diffusers import DiffusionPipeline  # fallback genérico; puedes dejar FluxPipeline si lo tienes
-logging.basicConfig(level=logging.INFO, format="%(asctime)s - APP - %(levelname)s - %(message)s")
-logger = logging.getLogger(__name__)
-# -------- CONFIG (ajusta) ----------
-HUGGINGFACE_TOKEN = os.getenv("HUGGINGFACE_TOKEN", None)
-# Model names (ajusta a los subfolders que usas)
-GEOMETRY_SUBFOLDER = "Step1X-3D-Geometry-Label-1300m"
-TEXTURE_SUBFOLDER = "Step1X-3D-Texture"
-STEP1X_MODEL_REPO = "stepfun-ai/Step1X-3D"  # repo base
-# Para text-to-image: usa tu modelo preferido; aquí dejo un placeholder
-IMAGE_GEN_MODEL = "camenduru/FLUX.1-dev-diffusers"  # si usas Flux o diffusers
-# Folder para caché/temporales (por sesión)
-TMP_ROOT = os.path.join(os.path.dirname(os.path.abspath(__file__)), "tmp")
-os.makedirs(TMP_ROOT, exist_ok=True)
-# -----------------------------------
 device = "cuda" if torch.cuda.is_available() else "cpu"
-logger.info(f"Device: {device}")
-# ---------- Inicialización de modelos (se hace en __main__) -----------
-geometry_model = None
-texture_model = None
-image_gen_pipeline = None
-# ---------- FUNCIONES ----------
-def start_session(req: gr.Request):
-    session_hash = str(req.session_hash)
-    user_dir = os.path.join(TMP_ROOT, session_hash)
-    logger.info(f"[{session_hash}] start_session -> {user_dir}")
-    os.makedirs(user_dir, exist_ok=True)
-def end_session(req: gr.Request):
-    session_hash = str(req.session_hash)
-    user_dir = os.path.join(TMP_ROOT, session_hash)
-    logger.info(f"[{session_hash}] end_session -> {user_dir}")
-    if os.path.exists(user_dir):
-        try:
-            shutil.rmtree(user_dir)
-            logger.info(f"[{session_hash}] user dir removed")
-        except Exception as e:
-            logger.warning(f"[{session_hash}] failed removing user dir: {e}")
-def save_pil_image_for_session(img: Image.Image, req: gr.Request, name="generated.png") -> str:
-    session_hash = str(req.session_hash)
-    user_dir = os.path.join(TMP_ROOT, session_hash)
-    os.makedirs(user_dir, exist_ok=True)
-    path = os.path.join(user_dir, name)
-    img.save(path)
-    return path
-# ---------- Generar imagen desde prompt ----------
-@spaces.GPU  # si usas spaces.GPU; si no, puedes quitar
-def generate_image_from_text(
-    prompt: str,
-    seed: int,
-    randomize_seed: bool,
-    width: int,
-    height: int,
-    guidance_scale: float,
-    req: gr.Request,
-    progress: gr.Progress = gr.Progress(track_tqdm=True),
-) -> Image.Image:
-    """Genera una imagen 2D desde prompt y devuelve PIL.Image"""
-    global image_gen_pipeline
-    session_hash = str(req.session_hash)
-    logger.info(f"[{session_hash}] Generando imagen desde texto: '{prompt[:80]}'")
-    if randomize_seed:
-        seed = int(np.random.randint(0, np.iinfo(np.int32).max))
-        logger.info(f"[{session_hash}] seed aleatorio -> {seed}")
-    generator = torch.Generator(device=device).manual_seed(seed) if device == "cuda" else torch.manual_seed(seed)
-    # Ajusta la llamada según el pipeline que uses (FluxPipeline, DiffusionPipeline, etc.)
-    # Ejemplo genérico con DiffusionPipeline (puede necesitar rename de args)
-    result = image_gen_pipeline(
-        prompt,
-        guidance_scale=float(guidance_scale),
-        num_inference_steps=8,
-        width=int(width),
-        height=int(height),
-        generator=generator,
-    )
-    image = result.images[0] if hasattr(result, "images") else result  # compat
-    # Guarda la imagen en carpeta de sesión
-    path = save_pil_image_for_session(image, req, name="generated_2d_image.png")
-    logger.info(f"[{session_hash}] imagen guardada en: {path}")
-    return image
-# ---------- Generar geometría a partir de imagen ----------
-@spaces.GPU(duration=180)
-def generate_geometry(
-    input_image: Union[str, Image.Image],
-    guidance_scale,
-    inference_steps,
-    max_facenum,
-    symmetry,
-    edge_type,
-    req: gr.Request,
-    progress: gr.Progress = gr.Progress(track_tqdm=True),
-):
     """
-    Genera la geometría usando Step1X geometry pipeline.
-    input_image puede ser path (str) o PIL.Image.
-    Devuelve (geometry_preview_path, geometry_path_state)
     """
-    global geometry_model
-    session_hash = str(req.session_hash)
-    logger.info(f"[{session_hash}] Iniciando generación de geometría...")
-    if isinstance(input_image, str):
-        image_input = input_image
-    else:
-        # PIL.Image
-        image_input = save_pil_image_for_session(input_image, req, name="for_geometry.png")
-    if input_image is None:
-        raise gr.Error("Por favor, sube o genera una imagen antes de generar la geometría.")
-    # Lógica adaptada según si el modelo espera label u otros args
-    if "Label" in GEOMETRY_SUBFOLDER:
         symmetry_values = ["x", "asymmetry"]
         out = geometry_model(
-            image_input,
             label={"symmetry": symmetry_values[int(symmetry)], "edge_type": edge_type},
             guidance_scale=float(guidance_scale),
             octree_resolution=384,
@@ -162,161 +149,145 @@ def generate_geometry(
         )
     else:
         out = geometry_model(
-            image_input,
             guidance_scale=float(guidance_scale),
             num_inference_steps=int(inference_steps),
             max_facenum=int(max_facenum),
         )
-    save_name = str(uuid.uuid4())
-    geometry_save_path = os.path.join(TMP_ROOT, session_hash, f"{save_name}.glb")
     geometry_mesh = out.mesh[0]
     geometry_mesh.export(geometry_save_path)
     torch.cuda.empty_cache()
-    logger.info(f"[{session_hash}] Geometría guardada en: {geometry_save_path}")
-    # Devuelve la ruta para preview (Model3D) y para guardar en el state
-    return geometry_save_path, geometry_save_path
-# ---------- Generar textura a partir de geometría ----------
 @spaces.GPU(duration=120)
-def generate_texture(input_image: Union[str, Image.Image], geometry_path: str, req: gr.Request, progress: gr.Progress = gr.Progress(track_tqdm=True)):
-    global texture_model
-    session_hash = str(req.session_hash)
-    logger.info(f"[{session_hash}] Iniciando texturizado para: {geometry_path}")
     if not geometry_path or not os.path.exists(geometry_path):
-        raise gr.Error("Por favor, primero genera la geometría antes de texturizar.")
-    if isinstance(input_image, str):
-        img_path = input_image
-    else:
-        img_path = save_pil_image_for_session(input_image, req, name="for_texture.png")
-    # Carga y postprocesado
-    import trimesh
     geometry_mesh = trimesh.load(geometry_path)
     geometry_mesh = remove_degenerate_face(geometry_mesh)
     geometry_mesh = reduce_face(geometry_mesh)
-    textured_mesh = texture_model(img_path, geometry_mesh)
-    save_name = os.path.basename(geometry_path).replace(".glb", "")
-    textured_save_path = os.path.join(TMP_ROOT, session_hash, f"{save_name}-textured.glb")
     textured_mesh.export(textured_save_path)
     torch.cuda.empty_cache()
-    logger.info(f"[{session_hash}] Malla texturizada guardada en: {textured_save_path}")
     return textured_save_path
-# ---------- Interfaz Gradio ----------
-with gr.Blocks(title="Text → Image → 3D (Step1X Flow)") as demo:
-    gr.Markdown("# Text → Image → 3D (Step1X) - Demo integrada")
-    gr.Markdown("Flujo: Texto → Generar imagen → Generar geometría → Texturizar")
     geometry_path_state = gr.State()
-    generated_image_state = gr.State()
     with gr.Row():
         with gr.Column(scale=2):
-            prompt = gr.Textbox(label="Prompt", placeholder="Describe el asset que quieres generar")
-            with gr.Accordion("Image Generation Settings", open=False):
-                seed = gr.Slider(0, int(2**31-1), label="Seed", value=42, step=1)
                 randomize_seed = gr.Checkbox(label="Randomize Seed", value=True)
-                with gr.Row():
-                    width = gr.Slider(256, 1024, label="Width", value=512, step=64)
-                    height = gr.Slider(256, 1024, label="Height", value=512, step=64)
-                guidance_scale = gr.Slider(0.0, 10.0, label="Guidance Scale", value=3.5, step=0.1)
-            generate_image_btn = gr.Button("1. Generar Imagen")
-            generate_geo_btn = gr.Button("2. Generar Geometría", interactive=False, visible=True)
-            generate_tex_btn = gr.Button("3. Generar Textura", interactive=False, visible=False)
         with gr.Column(scale=3):
-            generated_image = gr.Image(label="Imagen generada (2D)", type="pil")
-            geometry_preview = gr.Model3D(label="Geometría (GLB)", height=360)
-            textured_preview = gr.Model3D(label="Modelo texturizado (GLB)", height=360)
         with gr.Column(scale=1):
-            gr.Markdown("**Parámetros Geometría**")
-            guidance_geom = gr.Number(label="Guidance Scale geom", value=7.5)
-            inference_steps_geom = gr.Slider(1, 100, label="Pasos inferencia geom", value=50)
-            max_facenum = gr.Number(label="Máx. número de caras", value=400000)
-            symmetry = gr.Radio(choices=["symmetry", "asymmetry"], label="Tipo de simetría", value="symmetry", type="index")
-            edge_type = gr.Radio(choices=["sharp", "normal", "smooth"], label="Tipo de borde", value="sharp", type="value")
-    # Session handlers
-    demo.load(start_session)
-    demo.unload(end_session)
-    # 1) Generar imagen desde texto
-    generate_image_btn.click(
         fn=generate_image_from_text,
-        inputs=[prompt, seed, randomize_seed, width, height, guidance_scale],
-        outputs=[generated_image],
     ).then(
-        # cuando la imagen esté lista, habilitar el botón de generar geometría
-        lambda: gr.update(interactive=True),
-        outputs=[generate_geo_btn],
     )
-    # 2) Generar geometría desde la imagen generada
-    # usamos generated_image (PIL) y enviamos a generate_geometry
-    generate_geo_btn.click(
         fn=generate_geometry,
-        inputs=[
-            generated_image,  # PIL image
-            guidance_geom,
-            inference_steps_geom,
-            max_facenum,
-            symmetry,
-            edge_type,
-        ],
-        outputs=[geometry_preview, geometry_path_state],
     ).then(
-        # habilitar el botón de generar textura
-        lambda: (gr.update(interactive=True), gr.update(visible=True)),
-        outputs=[generate_tex_btn, textured_preview]
     )
-    # 3) Texturizar la geometría
-    generate_tex_btn.click(
         fn=generate_texture,
-        inputs=[generated_image, geometry_path_state],
         outputs=[textured_preview],
     )
-# ---------- Carga de modelos en main ----------
-if __name__ == "__main__":
-    # --------- Inicializar image generation pipeline ----------
-    try:
-        # Si tienes un pipeline específico (FluxPipeline) reemplaza la línea siguiente
-        logger.info("Inicializando pipeline de generación de imágenes...")
-        image_gen_pipeline = DiffusionPipeline.from_pretrained(IMAGE_GEN_MODEL, use_auth_token=HUGGINGFACE_TOKEN)
-        image_gen_pipeline = image_gen_pipeline.to(device)
-        logger.info("Pipeline de imagen cargado.")
-    except Exception as e:
-        logger.error(f"Error cargando pipeline de imágenes: {e}")
-        image_gen_pipeline = None
-    # --------- Inicializar Step1X modelos ----------
-    try:
-        logger.info("Cargando modelo de geometría Step1X...")
-        geometry_model = Step1X3DGeometryPipeline.from_pretrained(STEP1X_MODEL_REPO, subfolder=GEOMETRY_SUBFOLDER).to(device)
-        logger.info("Modelo de geometría cargado.")
-    except Exception as e:
-        logger.error(f"Error cargando modelo de geometría: {e}")
-        geometry_model = None
-    try:
-        logger.info("Cargando modelo de textura Step1X...")
-        texture_model = Step1X3DTexturePipeline.from_pretrained(STEP1X_MODEL_REPO, subfolder=TEXTURE_SUBFOLDER)
-        logger.info("Modelo de textura cargado.")
-    except Exception as e:
-        logger.error(f"Error cargando modelo de textura: {e}")
-        texture_model = None
-    # Lanzar app
-    demo.launch(show_error=True)

+# ==============================================================================
+# 1. INSTALACIÓN DEL ENTORNO Y DEPENDENCIAS
+# ==============================================================================
 import os
+import shlex
+import spaces
+import subprocess
 import logging
+# Configuración del logging
+logging.basicConfig(level=logging.INFO, format='%(asctime)s - Step1X-3D - %(levelname)s - %(message)s')
+def install_dependencies():
+    """Instala el toolkit de CUDA y compila las extensiones C++/CUDA necesarias."""
+    logging.info("Iniciando la instalación de dependencias...")
+    CUDA_TOOLKIT_URL = "https://developer.download.nvidia.com/compute/cuda/12.4.0/local_installers/cuda_12.4.0_550.54.14_linux.run"
+    CUDA_TOOLKIT_FILE = f"/tmp/{os.path.basename(CUDA_TOOLKIT_URL)}"
+    if not os.path.exists("/usr/local/cuda"):
+        logging.info("Descargando e instalando CUDA Toolkit...")
+        subprocess.call(["wget", "-q", CUDA_TOOLKIT_URL, "-O", CUDA_TOOLKIT_FILE])
+        subprocess.call(["chmod", "+x", CUDA_TOOLKIT_FILE])
+        subprocess.call([CUDA_TOOLKIT_FILE, "--silent", "--toolkit"])
+    else:
+        logging.info("CUDA Toolkit ya está instalado.")
+    os.environ["CUDA_HOME"] = "/usr/local/cuda"
+    os.environ["PATH"] = f"{os.environ['CUDA_HOME']}/bin:{os.environ['PATH']}"
+    os.environ["LD_LIBRARY_PATH"] = f"{os.environ['CUDA_HOME']}/lib:{os.environ.get('LD_LIBRARY_PATH', '')}"
+    os.environ["TORCH_CUDA_ARCH_LIST"] = "8.0;8.6"
+    logging.info("Compilando extensiones de renderizado...")
+    renderer_path = "/home/user/app/step1x3d_texture/differentiable_renderer/"
+    subprocess.run(f"cd {renderer_path} && python setup.py install", shell=True, check=True)
+    subprocess.run(shlex.split("pip install custom_rasterizer-0.1-cp310-cp310-linux_x86_64.whl"), check=True)
+    logging.info("Instalación completada.")
+    os.system('nvcc -V')
+install_dependencies()
+import uuid
+import torch
+import trimesh
+import argparse
+import random
+import numpy as np
 import gradio as gr
 from PIL import Image
+from diffusers import FluxPipeline, FluxTransformer2DModel
+from transformers import T5EncoderModel
 from step1x3d_geometry.models.pipelines.pipeline import Step1X3DGeometryPipeline
+from step1x3d_texture.pipelines.step1x_3d_texture_synthesis_pipeline import Step1X3DTexturePipeline
 from step1x3d_geometry.models.pipelines.pipeline_utils import reduce_face, remove_degenerate_face
+# ==============================================================================
+# 2. CONFIGURACIÓN Y CARGA DE MODELOS
+# ==============================================================================
+parser = argparse.ArgumentParser()
+parser.add_argument("--geometry_model", type=str, default="Step1X-3D-Geometry-Label-1300m")
+parser.add_argument("--texture_model", type=str, default="Step1X-3D-Texture")
+parser.add_argument("--cache_dir", type=str, default="cache")
+args = parser.parse_args()
+os.makedirs(args.cache_dir, exist_ok=True)
 device = "cuda" if torch.cuda.is_available() else "cpu"
+torch_dtype = torch.bfloat16 # bfloat16 es mejor para FLUX
+MAX_SEED = np.iinfo(np.int32).max
+logging.info("Cargando modelos... Este proceso puede tardar varios minutos.")
+# --- Carga del modelo FLUX para Texto a Imagen ---
+logging.info("Cargando modelo FLUX.1-dev...")
+flux_pipe = FluxPipeline.from_pretrained(
+    "black-forest-labs/FLUX.1-dev",
+    torch_dtype=torch_dtype,
+    variant="fp16" # Usar fp16 para menor uso de memoria
+)
+flux_pipe.to(device)
+logging.info("Modelo FLUX cargado.")
+# --- Carga de Modelos Step1X-3D ---
+logging.info(f"Cargando modelo de geometría: {args.geometry_model}")
+geometry_model = Step1X3DGeometryPipeline.from_pretrained(
+    "stepfun-ai/Step1X-3D", subfolder=args.geometry_model
+).to(device)
+logging.info(f"Cargando modelo de textura: {args.texture_model}")
+texture_model = Step1X3DTexturePipeline.from_pretrained("stepfun-ai/Step1X-3D", subfolder=args.texture_model)
+logging.info("Todos los modelos han sido cargados correctamente.")
+# ==============================================================================
+# 3. FUNCIONES DE GENERACIÓN POR PASOS
+# ==============================================================================
+@spaces.GPU(duration=60)
+def generate_image_from_text(prompt, negative_prompt, guidance_scale, num_steps, seed, randomize_seed):
     """
+    Paso 0: Genera una imagen 2D a partir de un texto usando FLUX.
     """
+    if not prompt:
+        raise gr.Error("El prompt no puede estar vacío.")
+    if randomize_seed:
+        seed = random.randint(0, MAX_SEED)
+    generator = torch.Generator(device=device).manual_seed(int(seed))
+    logging.info(f"Generando imagen con prompt: '{prompt}', Seed: {seed}")
+    # Añadir modificadores para mejorar la calidad y el estilo 3D
+    final_prompt = f"3d model, {prompt}, octane render, professionally rendered, high quality, white background"
+    image = flux_pipe(
+        prompt=final_prompt,
+        negative_prompt=negative_prompt,
+        num_inference_steps=int(num_steps),
+        guidance_scale=float(guidance_scale),
+        generator=generator,
+    ).images[0]
+    save_name = str(uuid.uuid4())
+    image_save_path = f"{args.cache_dir}/{save_name}_generated_image.png"
+    image.save(image_save_path)
+    logging.info(f"Imagen 2D generada y guardada en: {image_save_path}")
+    return image_save_path, seed
+@spaces.GPU(duration=180)
+def generate_geometry(input_image_path, guidance_scale, inference_steps, max_facenum, symmetry, edge_type):
+    """Paso 1: Genera la geometría a partir de la imagen generada."""
+    if not input_image_path or not os.path.exists(input_image_path):
+        raise gr.Error("Primero debes generar una imagen a partir del texto.")
+    logging.info(f"Iniciando generación de geometría desde: {os.path.basename(input_image_path)}")
+    if "Label" in args.geometry_model:
         symmetry_values = ["x", "asymmetry"]
         out = geometry_model(
+            input_image_path,
             label={"symmetry": symmetry_values[int(symmetry)], "edge_type": edge_type},
             guidance_scale=float(guidance_scale),
             octree_resolution=384,
         )
     else:
         out = geometry_model(
+            input_image_path,
             guidance_scale=float(guidance_scale),
             num_inference_steps=int(inference_steps),
             max_facenum=int(max_facenum),
         )
+    save_name = os.path.basename(input_image_path).replace("_generated_image.png", "")
+    geometry_save_path = f"{args.cache_dir}/{save_name}_geometry.glb"
     geometry_mesh = out.mesh[0]
     geometry_mesh.export(geometry_save_path)
     torch.cuda.empty_cache()
+    logging.info(f"Geometría guardada en: {geometry_save_path}")
+    return geometry_save_path
 @spaces.GPU(duration=120)
+def generate_texture(input_image_path, geometry_path):
+    """Paso 2: Aplica la textura a la geometría generada."""
     if not geometry_path or not os.path.exists(geometry_path):
+        raise gr.Error("Por favor, primero genera la geometría.")
+    if not input_image_path or not os.path.exists(input_image_path):
+        raise gr.Error("Se necesita la imagen generada para el texturizado.")
+    logging.info(f"Iniciando texturizado para la malla: {os.path.basename(geometry_path)}")
     geometry_mesh = trimesh.load(geometry_path)
+    # Post-procesamiento
     geometry_mesh = remove_degenerate_face(geometry_mesh)
     geometry_mesh = reduce_face(geometry_mesh)
+    textured_mesh = texture_model(input_image_path, geometry_mesh)
+    save_name = os.path.basename(geometry_path).replace("_geometry.glb", "")
+    textured_save_path = f"{args.cache_dir}/{save_name}_textured.glb"
     textured_mesh.export(textured_save_path)
     torch.cuda.empty_cache()
+    logging.info(f"Malla texturizada guardada en: {textured_save_path}")
     return textured_save_path
+# ==============================================================================
+# 4. INTERFAZ DE GRADIO
+# ==============================================================================
+with gr.Blocks(title="Step1X-3D: Texto a 3D", css="footer {display: none !important;} a {text-decoration: none !important;}") as demo:
+    gr.Markdown("# Step1X-3D: Flujo de Texto a 3D")
+    gr.Markdown("Flujo de trabajo en 3 pasos: **0. Texto a Imagen → 1. Generar Geometría → 2. Generar Textura**")
+    # Estados para mantener las rutas de los archivos
+    generated_image_path_state = gr.State()
     geometry_path_state = gr.State()
     with gr.Row():
         with gr.Column(scale=2):
+            # --- Panel de Entradas ---
+            prompt = gr.Textbox(label="Paso 0: Describe el objeto 3D que quieres crear", value="a detailed, realistic battle axe")
+            with gr.Accordion(label="Opciones Avanzadas", open=False):
+                gr.Markdown("### Opciones de Texto a Imagen (Paso 0)")
+                neg_prompt = gr.Textbox(label="Negative Prompt (Imagen)", value="blurry, low quality, bad, text, watermark")
+                guidance_image = gr.Slider(0.0, 10.0, label="Guidance Scale (Imagen)", value=4.0, step=0.1)
+                steps_image = gr.Slider(10, 50, label="Steps (Imagen)", value=28, step=1)
+                seed = gr.Slider(0, MAX_SEED, label="Seed", value=0, step=1)
                 randomize_seed = gr.Checkbox(label="Randomize Seed", value=True)
+                gr.Markdown("---")
+                gr.Markdown("### Opciones de Generación 3D (Paso 1)")
+                guidance_3d = gr.Number(label="Guidance Scale (3D)", value="7.5")
+                steps_3d = gr.Slider(label="Inference Steps (3D)", minimum=1, maximum=100, value=50)
+                max_facenum = gr.Number(label="Max Face Num", value="200000")
+                symmetry = gr.Radio(choices=["symmetry", "asymmetry"], label="Symmetry", value="symmetry", type="index")
+                edge_type = gr.Radio(choices=["sharp", "normal", "smooth"], label="Edge Type", value="sharp", type="value")
+            with gr.Row():
+                btn_gen_image = gr.Button("0. Generar Imagen", variant="secondary")
+            with gr.Row():
+                btn_geo = gr.Button("1. Generar Geometría", interactive=False)
+                btn_tex = gr.Button("2. Generar Textura", interactive=False)
         with gr.Column(scale=3):
+            # --- Panel de Salidas ---
+            image_preview = gr.Image(label="Resultado de Texto a Imagen", type="filepath", interactive=False, height=400)
+            geometry_preview = gr.Model3D(label="Vista Previa de la Geometría", height=400, clear_color=[0.0, 0.0, 0.0, 0.0])
+            textured_preview = gr.Model3D(label="Vista Previa del Modelo Texturizado", height=400, clear_color=[0.0, 0.0, 0.0, 0.0])
         with gr.Column(scale=1):
+            gr.Examples(
+                examples=[
+                    ["a small wooden chest with gold trim"],
+                    ["a futuristic sci-fi pistol"],
+                    ["a cute, chibi-style red dragon"],
+                    ["a slice of pizza with pepperoni and mushrooms"],
+                    ["a classic leather-bound book with a gold clasp"],
+                ],
+                inputs=[prompt], cache_examples=False
+            )
+    # --- Lógica de la Interfaz ---
+    def on_image_generated(path, current_seed):
+        return {
+            generated_image_path_state: path,
+            btn_geo: gr.update(interactive=True, variant="primary"),
+            btn_tex: gr.update(interactive=False),
+            geometry_preview: gr.update(value=None),
+            textured_preview: gr.update(value=None),
+            seed: gr.update(value=int(current_seed)) # Actualiza el slider de la seed
+        }
+    def on_geometry_generated(path):
+        return {
+            geometry_path_state: path,
+            btn_tex: gr.update(interactive=True, variant="primary"),
+        }
+    btn_gen_image.click(
         fn=generate_image_from_text,
+        inputs=[prompt, neg_prompt, guidance_image, steps_image, seed, randomize_seed],
+        outputs=[image_preview, seed]
     ).then(
+        fn=on_image_generated,
+        inputs=[image_preview, seed],
+        outputs=[generated_image_path_state, btn_geo, btn_tex, geometry_preview, textured_preview, seed]
     )
+    btn_geo.click(
         fn=generate_geometry,
+        inputs=[generated_image_path_state, guidance_3d, steps_3d, max_facenum, symmetry, edge_type],
+        outputs=[geometry_preview]
     ).then(
+        fn=on_geometry_generated,
+        inputs=[geometry_preview],
+        outputs=[geometry_path_state, btn_tex]
     )
+    btn_tex.click(
         fn=generate_texture,
+        inputs=[generated_image_path_state, geometry_path_state],
         outputs=[textured_preview],
     )
+demo.launch(ssr_mode=False)