A IA de conversão de texto em imagem tem sido um pé no saco dos artistas, agora é hora dos cineastas sentirem a dor. Uma empresa chamada Runway Research nos apresentou o Gen-2 (via Tom’s Guide). Este é um bot de conversão de texto em vídeo com inteligência artificial que parece muito bom… apavorante bom.
A OpenAI é uma estrela do rock na indústria de IA, produzindo sucessos como DALL-E e ChatGPT. No entanto, a empresa não nos deu uma amostra dos recursos de texto para vídeo. Com o GPT-4, pensamos que veríamos algo assim; no entanto, provou ser ChatGPT-3 com esteróides.
Runway Research empurra Gen-2 pela “pista”
Portanto, a tecnologia de texto para imagem já é trabalhosa. Gerar aquela imagem de uma princesa guerreira com as mãos bagunçadas exige uma tonelada métrica de informações e poder de processamento. Então, trazer isso para o vídeo full-motion parecia algo saído de um filme de ficção científica. No entanto, está acontecendo.
Nomeada Gen-2, esta é a segunda geração da ideia da Runway Research, e a empresa mostrou como ela melhorou em relação à Gen-1. Você pode ver alguns exemplos do que o Gen-2 pode fazer aqui.
Agora, há algumas coisas a saber antes de ficar animado. Para começar, esta ferramenta ainda não está disponível. Não sabemos quando chegará ao público, mas a empresa diz “em breve”.
Além disso, não comece a planejar seu próximo curta-metragem. Até agora, o Gen-2 só pode produzir loops de vídeo de 3 segundos. Então, basicamente fará GIFs por enquanto. Em qualquer caso, ainda é impressionante.
Você poderá gerar videoclipes curtos a partir de prompts de texto, mas também poderá usar a entrada de vídeo. Há um clipe com um homem virando a cabeça para a câmera. Esse é o vídeo de entrada. A saída mostra uma criatura (com base nas imagens de origem) virando a cabeça. Há outro exemplo em que o Gen-2 pegou um vídeo de origem de um golden retriever e adicionou pontos dálmatas.
Isso é algo que vai trazer Runway ainda mais para o centro das atenções. No momento, a OpenAI está liderando a corrida da IA, no que diz respeito ao público, com o Google atrás. Outra empresa adicionando combustível ao fogo tornará as coisas interessantes na corrida da IA.