import gradio as gr from transformers import pipeline from diffusers import StableDiffusionPipeline import torch # Carga del modelo de reescritura en español text2text = pipeline("text-generation", model="openai-community/gpt2-large") # Configuración de dispositivo para Stable Diffusion device = "cuda" if torch.cuda.is_available() else "cpu" diffusion = StableDiffusionPipeline.from_pretrained( "stabilityai/stable-diffusion-2-1", torch_dtype=torch.float16 if device == "cuda" else torch.float32 ).to(device) # Función principal def generate(text): # Pedimos al modelo que genere una frase más visual prompt = f"Describe de forma visual y detallada en español: {text}" improved = text2text(prompt, max_length=60, do_sample=True)[0]["generated_text"] improved_cleaned = improved.replace("Describe de forma visual y detallada en español:", "").strip() print(f"Texto mejorado: {improved_cleaned}") # Generamos imagen con la frase mejorada image = diffusion(improved_cleaned).images[0] return improved_cleaned, image # Interfaz Gradio with gr.Blocks(theme=gr.themes.Base()) as demo: gr.Markdown("# 🎨 Generador de Imágenes desde Texto en Español") with gr.Row(): with gr.Column(): inp = gr.Textbox(label="Introduce una descripción breve", placeholder="Ej: Persona mayor sentada en un banco") btn = gr.Button("Generar imagen") with gr.Column(): out_text = gr.Textbox(label="Texto mejorado para la imagen") out_img = gr.Image(label="Imagen generada") btn.click(fn=generate, inputs=inp, outputs=[out_text, out_img]) demo.launch()