Em poucos meses, o mundo da IA generativa evoluiu de chatbots como o ChatGPT para imagens fotorrealistas criadas pela Midjourney. Caso você pense que as coisas vão desacelerar em breve, os vídeos gerados por IA podem estar prestes a ter seu grande momento no centro das atenções.
Conforme destacado por um twittar de Philipp Tsipman, o fundador de uma plataforma de marketing para esses vídeos, houve cinco novos geradores de vídeo AI lançados apenas nos últimos sete dias. A qualidade varia, mas é claro que a tecnologia está se movendo em um ritmo implacável. Então, vamos detalhar os cinco geradores de vídeo AI, que variam de irregulares a seriamente impressionantes.
Pista
A Runway lidera o grupo na edição de IA disponível publicamente. Mascaramento, rastreamento de movimento, super câmera lenta e gradação de cores se beneficiam da assistência da IA. Este é um serviço baseado em assinatura, por isso tem um incentivo extra para ultrapassar os limites.
Em fevereiro, a Runway começou a testar vídeos generativos com sua atualização Gen-1, que permite reestilizar um vídeo com palavras. Um vídeo de uma caminhada na rua se torna um curta animado que parece ser feito com personagens Claymation esculpidos à mão e posados.
A Runway lançou o Gen-1 publicamente hoje e já está testando o Gen-2, eliminando a necessidade de um vídeo de referência. Em breve, o Runway permitirá que você crie um vídeo com um simples prompt de texto.
Picsart
Você pode reconhecer o Picsart como um editor de fotos gratuito, mas também oferece edição de vídeo. Text2Video-Zero é uma ferramenta de pesquisa Picsart que usa o gerador de imagens Stable Diffusion AI para criar vários quadros com o suficiente em comum para parecerem coesos.
Este é um progresso significativo. já que os primeiros experimentos na montagem de imagens de IA como quadros de vídeo produziram cenas caóticas onde todos os detalhes mudavam constantemente. O efeito era atraente, mas desviava a atenção do conteúdo.
Vídeo-P2P
Video-P2P é um projeto de código aberto semelhante ao Runway Gen-1. É preciso entrada de vídeo e usa Stable Diffusion para estilizá-lo com prompts de texto. Os exemplos mostrados parecem bons, com planos de fundo estáveis e consistência nos elementos alterados.
TemporalNet
O TemporalNet é baseado no ControlNet, um avançado gerador de imagens AI que permite mais controle das poses das figuras que aparecem nas imagens.
Os vídeos têm alguma oscilação, mas os resultados são promissores. A ControlNet deu um grande passo em direção à produção de cenas previsíveis, e a TemporalNet pode fornecer um bom método alternativo de criação de vídeos.
Texto para vídeo
Text-to-video é um modelo de IA criado pelo Alibaba. É claro que esse modelo precisa de um pouco mais de trabalho, mas ter mais opções para explorar é sempre bom.
Inovação em ritmo acelerado
O ritmo acelerado da inovação da IA é fenomenal. Apenas alguns meses atrás, fomos provocados com vislumbres do potencial de vídeos semelhantes criados em laboratórios de IA. Em 2022, um dos primeiros geradores públicos de vídeo de IA simplesmente sobrepôs pequenas imagens de IA a imagens de arquivo.
Esses métodos da “velha escola”, de alguns meses atrás, são ridículos quando você vê o quanto a IA progrediu em tão pouco tempo.
Recomendações dos editores