Inteligencia Artificial

Procedimiento para la generación de video con PixVerse AI

1. INTRODUCCIÓN

El presente informe describe el proceso de creación de tres videos generados con inteligencia artificial mediante la plataforma PixVerse AI. Los videos corresponden a dos proyectos diferenciados: una campaña publicitaria corporativa para el vehículo Toyota Land Cruiser 2026, y una animación educativa sobre teoría de grafos destinada a entornos académicos universitarios.

El objetivo de este documento es documentar de manera sistemática y reproducible el flujo de trabajo empleado en cada caso, describiendo las modalidades de generación utilizadas, los parámetros técnicos configurados, los prompts redactados y el guion de locución correspondiente. Se busca con ello que el informe sirva tanto como referencia metodológica como evidencia del proceso creativo seguido.

PixVerse AI es una plataforma de generación de video mediante inteligencia artificial que permite producir contenido audiovisual de alta calidad a partir de texto (modalidad Text-to-Video) o de una imagen de referencia (modalidad Image-to-Video). Su modelo más reciente, PixVerse V5, lanzado en agosto de 2025, se posiciona entre las principales herramientas del mercado según los índices de Artificial Analysis, en competencia directa con plataformas como Google Veo 3, Runway y Pika Labs.

2. DESCRIPCIÓN DE LA PLATAFORMA PIXVERSE AI

PixVerse opera bajo tres modalidades principales de generación de contenido. La primera, denominada Text-to-Video, permite construir un clip audiovisual completo a partir de una descripción escrita en lenguaje natural. La segunda, Image-to-Video, toma una imagen estática como fotograma de referencia y genera a partir de ella un video animado con movimiento cinematográfico. La tercera modalidad, Extend and Transition, extiende clips existentes o produce transiciones entre fotogramas predefinidos.

En cuanto a sus capacidades técnicas, la plataforma admite resoluciones de hasta 4K con renderizado cinematográfico realista, control de movimiento de cámara (zoom, rotación, paneo, travelling y seguimiento), generación de resultados en tiempos que oscilan entre 5 y 60 segundos según el modelo seleccionado, y herramientas de sincronización labial (Lip Sync) para personajes animados. El acceso se encuentra disponible mediante aplicación web, aplicación móvil para Android e iOS, y una API para desarrolladores.

3. CASO 1 — VIDEO CORPORATIVO

3.1. Descripción general del proyecto

Para la campaña publicitaria de la nueva Toyota Land Cruiser 2026 se generaron dos videos complementarios en PixVerse, cada uno empleando una modalidad diferente de la plataforma. El primero se produjo íntegramente mediante texto, sin imagen de entrada, mientras que el segundo utilizó una fotografía real del vehículo como base visual. Ambos comparten el mismo prompt descriptivo y el mismo guion de locución, con el fin de garantizar coherencia narrativa y estilística en el conjunto de la campaña.

3.2. Video 1 — Modalidad Text-to-Video: procedimiento paso a paso

Paso 1. Acceso a la plataforma.

Ingresar al navegador web y dirigirse a www.pixverse.ai. Iniciar sesión con cuenta registrada o crear una nueva cuenta de forma gratuita.

Paso 2. Selección del modo Text-to-Video.

En el panel de creación, hacer clic en el botón ‘Create’. Seleccionar la opción ‘Text to Video’. Esta modalidad genera el video completo a partir de la descripción textual, sin requerir material visual previo.

Paso 3. Configuración de parámetros técnicos.

Antes de redactar el prompt, ajustar las opciones disponibles en el panel lateral: duración (se recomienda el máximo disponible para video corporativo), resolución (1080p o 4K según el plan), estilo visual (‘Cinematic’ o ‘Realistic’) y activar el movimiento dinámico de cámara si la plataforma lo permite.

Paso 4. Ingreso del prompt principal.

Escribir o pegar la descripción completa del video en el campo de texto habilitado. El prompt debe especificar el sujeto, las escenas, el tipo de cámara, la iluminación, el estilo visual, el tono emocional y los textos en pantalla requeridos.

Prompt utilizado — Video 1 (Text-to-Video)

Crea un video publicitario cinematográfico ultra realista de la nueva Toyota Land Cruiser 2026. Estilo premium, elegante y épico. Mostrar la camioneta atravesando montañas, desierto, ciudad nocturna y caminos con barro. Tomas con drone, cámara lenta, luces LED encendiéndose, close-ups del interior de lujo, tablero digital, volante y detalles modernos. Ambiente poderoso y sofisticado, iluminación dramática, reflejos realistas, calidad 4K, estilo comercial de alta gama tipo Super Bowl. Música épica y energética. Colores oscuros con contraste cinematográfico. Agregar sensación de aventura, poder, exclusividad y libertad. Transiciones suaves y tomas dinámicas profesionales. Texto en pantalla: Nueva Toyota Land Cruiser — El mundo es tu territorio

Paso 5. Ingreso del guion de locución.

En el campo de texto adicional o diálogo, ingresar el guion de locución que acompañará el video como voz en off. Se recomienda que las frases sean cortas, contundentes y coherentes con el tono visual del prompt.

Guion de locución

“Algunos vehículos te llevan a tu destino… la nueva Land Cruiser te lleva más allá.”

“Diseñada para dominar cualquier terreno… y destacar en cualquier lugar.”

“Potencia que se siente. Tecnología que impresiona. Elegancia que impone presencia.”

“Cada curva… cada detalle… fue creado para quienes nunca se detienen.”

“Ciudad, montaña, desierto o aventura… no existen límites para la nueva Toyota Land Cruiser.”

“Más que una SUV… es una declaración de poder.”“Nueva Toyota Land Cruiser. El mundo no te espera… conquisítalo.”

Paso 6. Generación del video.

Hacer clic en el botón ‘Generate’. PixVerse procesará el prompt y producirá el video. El tiempo de procesamiento varía entre 2 y 5 minutos según la duración solicitada y la carga del servidor.

Paso 7. Revisión y descarga.

Reproducir el video generado en la plataforma para verificar la calidad del resultado. Si el video cumple con los requisitos, hacer clic en ‘Download’ para descargarlo en formato MP4. En caso contrario, ajustar el prompt y regenerar.

3.3. Video 2 — Modalidad Image-to-Video: procedimiento paso a paso

Este segundo video parte de una fotografía real de la Toyota Land Cruiser 2026 en ambiente de sala de exhibición (showroom). PixVerse toma dicha imagen como fotograma de referencia y aplica el prompt para generar movimiento, efectos cinematográficos y animación sobre la base visual existente. El mismo prompt y guion de locución del Video 1 se emplearon en este caso para mantener la coherencia de la campaña.

Paso 1. Acceso y selección de modalidad.

Ingresar a www.pixverse.ai. En el panel de creación, seleccionar la opción ‘Image to Video’. Esta modalidad difiere del Text-to-Video en que requiere una imagen de entrada como base visual.

Paso 2. Carga de la imagen de referencia.

Hacer clic en ‘Upload Image’ y seleccionar la fotografía del vehículo. El archivo puede estar en formato JPG, PNG o WEBP. PixVerse utilizará esta imagen como fotograma inicial del video generado.

Paso 3. Configuración de parámetros técnicos.

Ajustar: duración (8 o 16 segundos recomendados), resolución (preferiblemente equivalente a la de la imagen de entrada), activación del movimiento de cámara si la plataforma lo permite, y nivel de motion (bajo, medio o alto según el efecto deseado).

Paso 4. Ingreso del prompt y guion de locución.

Ingresar el mismo prompt descriptivo y el mismo guion de locución utilizados en el Video 1. El prompt guía la dirección del movimiento, los efectos visuales y el estilo cinematográfico aplicados sobre la imagen base.

Paso 5. Generación, revisión y descarga.

Hacer clic en ‘Generate’. El procesamiento puede tardar ligeramente más que en la modalidad Text-to-Video dado el análisis previo de la imagen. Al finalizar, revisar el resultado y descargar en formato MP4.

4. CASO 2 — VIDEO CREATIVO

4.1. Descripción general del proyecto

Este segundo caso corresponde a la producción de una animación educativa sobre teoría de grafos, orientada a estudiantes universitarios de matemáticas, ingeniería o ciencias de la computación. A diferencia del caso anterior, en este proyecto se empleó la modalidad Image-to-Video con una imagen de personaje como referencia visual, técnica denominada en algunos contextos como Character-to-Video.

El resultado es un video de estilo académico minimalista, con fondo blanco, diagramas de nodos y aristas, paleta cromática en morado y verde azulado (teal), y una locución que guía al espectador a través de nueve conceptos fundamentales de la teoría de grafos.

4.2. Parámetros técnicos del video

ParámetroValor / descripción
FondoBlanco limpio, sin texturas ni degradados
Paleta cromáticaMorado (#6C3FC5) y verde azulado / teal (#1A9E8F)
Estilo de animaciónMinimalista 2D — sin sombras fuertes, sin efectos tridimensionales
TransicionesFade-in suave entre escenas; estilo de presentación universitaria
Texto en pantallaEtiquetas de conceptos con tipografía limpia y legible
DuraciónMáxima disponible (9 escenas requieren tiempo de visualización)
Resolución1080p o 4K según disponibilidad del plan
Nivel de motionBajo a medio, para no interferir con la legibilidad de los diagramas

4.3. Procedimiento paso a paso

Paso 1. Acceso y selección de modalidad.

Ingresar a www.pixverse.ai. Seleccionar ‘Image to Video’ en el panel de creación.

Paso 2. Carga de la imagen del personaje.

Hacer clic en ‘Upload Image’ y cargar la imagen del personaje guía (robot o figura académica). PixVerse analizará la imagen y la empleará como ancla visual para todos los fotogramas del video generado.

Paso 3. Configuración de parámetros.

Ajustar duración al máximo disponible, resolución a 1080p o 4K, estilo ‘2D’ o ‘Anime’ (compatibles con animación educativa plana), y nivel de motion en bajo-medio.

Paso 4. Ingreso del prompt educativo.

Escribir o pegar el prompt completo en el campo de texto. El prompt debe especificar el fondo, la paleta de colores, los conceptos que deben aparecer en pantalla y el estilo académico de la animación.

Prompt utilizado — Video 3 (Teoría de grafos)Animación educativa sobre teoría de grafos. Fondo blanco limpio. Cada escena muestra un diagrama simple con nodos circulares etiquetados y aristas como líneas. Transiciones suaves entre escenas. Estilo moderno y minimalista, paleta de colores morado y verde azulado. El texto aparece en pantalla para cada concepto: grafo no dirigido, dígrafo, grado de un nodo, camino, ciclo, árbol, grafo completo, grafo bipartito. Estética académica y limpia. Animación 2D, sin personajes. Efectos de aparición suave para cada diagrama. Estilo de presentación universitaria.

Paso 5. Ingreso del guion por escenas.

En el campo de locución, ingresar el texto correspondiente a cada escena. El guion debe sincronizarse con los diagramas visuales que aparecen en pantalla.

#ConceptoGuion de locución
E1Introducción a los grafos“Un grafo tiene nodos y aristas. Así modelamos redes, mapas y conexiones del mundo real.”
E2Grafo no dirigido“En un grafo no dirigido, la conexión es recíproca. Como una amistad.”
E3Digrafo“En un digrafo, las aristas tienen dirección. Como seguir a alguien en redes sociales.”
E4Grado de un nodo“El grado de un nodo es cuántas aristas lo tocan.”
E5Camino y ciclo“Un camino no repite nodos. Si regresa al inicio, es un ciclo.”
E6Árbol“Un árbol es un grafo conexo sin ciclos.”
E7Grafo completo“En un grafo completo, todos los nodos están conectados entre sí.”
E8Grafo bipartito“Un grafo bipartito conecta dos grupos distintos de nodos.”
E9Aplicaciones reales“De los GPS hasta las redes sociales, los grafos están en todas partes.”

Paso 6. Generación del video.

Presionar ‘Generate’. Para videos con 9 escenas y una imagen de referencia, el tiempo estimado de procesamiento es de 3 a 6 minutos.

Paso 7. Revisión, ajuste y descarga.

Reproducir el video completo para verificar la correcta generación de los diagramas, etiquetas y transiciones. Si el resultado es satisfactorio, descargar en formato MP4. De lo contrario, ajustar el prompt y regenerar.

6. CONCLUSIONES

La experiencia documentada en el presente informe evidencia que las herramientas de generación de video mediante inteligencia artificial, y en particular PixVerse AI, han alcanzado un nivel de madurez suficiente para su incorporación en flujos de trabajo profesionales y académicos. Los tres videos producidos demuestran que es posible obtener resultados de calidad técnica elevada sin disponer de equipos de producción audiovisual ni conocimientos avanzados de edición de video, siempre que el proceso de redacción del prompt sea meticuloso y que los parámetros técnicos sean configurados de forma adecuada.

Créditos

Autor: Jhon Anderson Forero Díaz – Juan José Rodríguez Motta

Editor: Magister ingeniero Carlos Pinzón Romero

Código:  UCIA – 9

Universidad: Universidad Central

Referencias

PixVerse AI. (2025). PixVerse — AI video generation platform [Plataforma de software]. Recuperado de https://www.pixverse.ai
https://youtu.be/EH-MBbScOUQ?si=9TnyIS78aHvcArsj
https://www.linkedin.com/newsletters/pixverse-updates-7351444728850116608