El modelo de generación de imágenes de Gemini se llama Nano Banana y está disponible directamente en gemini.google.com sin costo para usuarios con cuenta de Google. La versión gratuita tiene límites diarios de generaciones, pero es más que suficiente para experimentar y aprender la técnica.
Por qué la mayoría de los prompts falla
El error más común es escribir el prompt como si fuera una búsqueda en Google. "Una foto de un gato" funciona, pero el resultado es genérico. La diferencia entre una imagen mediocre y una imagen sorprendente está en cuatro elementos que la IA necesita para trabajar con precisión.
La estructura del prompt perfecto
Todo prompt efectivo para imágenes tiene cuatro componentes.
- El sujeto: qué o quién aparece en la imagen y qué está haciendo. Cuanto más específico, mejor. No "una persona corriendo", sino "una mujer de 30 años corriendo en una pista de atletismo mojada por la lluvia".
- El estilo visual: qué tipo de imagen querés. Fotografía realista, ilustración, acuarela, pintura al óleo, estilo anime, arte conceptual, foto editorial. Sin este dato, Gemini elige el estilo por defecto.
- La iluminación y el ambiente: luz natural de amanecer, iluminación de estudio, contraluz dramático, luz de vela, noche con neón. La iluminación es lo que convierte una imagen plana en algo cinematográfico.
- La composición o el encuadre: primer plano, plano general, vista cenital, plano holandés, perspectiva de rana. Este elemento define desde dónde se "ve" la escena.
Ejemplos concretos para copiar y adaptar
- Prompt básico (resultado mediocre): "Un café en París".
- Prompt optimizado (resultado profesional): "fotografía editorial de una terraza de café parisino en otoño, con mesas redondas de hierro negro y sillas de mimbre, hojas doradas en el suelo, luz de tarde cálida y difusa, plano general con perspectiva levemente elevada, estilo revista de viajes, colores terrosos y dorados".
- Para retratos: añadí siempre la expresión facial ("mirada pensativa, leve sonrisa"), la distancia focal aparente ("retrato con lente 85mm, fondo ligeramente desenfocado") y el contexto de uso ("para portada de revista, para post de Instagram, para banner corporativo").
- Para productos: describí la superficie donde está apoyado, el fondo, los accesorios que lo rodean y el tipo de fotografía ("flat lay sobre mármol blanco con plantas verdes pequeñas, luz natural lateral, fotografía de producto para e-commerce").
MÁS INFO
El truco del estilo de referencia
El método más efectivo para obtener resultados consistentes es referenciar estilos conocidos. En lugar de describir desde cero, podés escribir "estilo fotografía de National Geographic", "estilo ilustración de portada de New Yorker", "estilo poster cinematográfico de los años 70" o "estilo fotografía de moda editorial Vogue". Gemini entiende esas referencias culturales y las traduce directamente a la imagen.
Un tip final: si el primer resultado no convence, no escribas un prompt completamente nuevo. Pedile a Gemini que mantenga todos los elementos, pero cambie solo uno: "misma imagen, pero con luz de noche en lugar de día" o "igual composición, pero en blanco y negro con alto contraste".
