Os vídeos gerados por IA chegaram e estão evoluindo rapidamente

Em poucos meses, o mundo da IA generativa evoluiu de chatbots como o ChatGPT para imagens fotorrealistas criadas pela Midjourney. Caso você pense que as coisas vão desacelerar em breve, os vídeos gerados por IA podem estar prestes a ter seu grande momento no centro das atenções.

Conforme destacado por um twittar de Philipp Tsipman, o fundador de uma plataforma de marketing para esses vídeos, houve cinco novos geradores de vídeo AI lançados apenas nos últimos sete dias. A qualidade varia, mas é claro que a tecnologia está se movendo em um ritmo implacável. Então, vamos detalhar os cinco geradores de vídeo AI, que variam de irregulares a seriamente impressionantes.

Se você está tendo problemas para acompanhar o Video AI, foram lançados 5 modelos de vídeo generativos de última geração *nos últimos 7 dias*: pic.twitter.com/cki9SMfozr
— Philipp Tsipman (@ptsi) 26 de março de 2023

Pista

A Runway lidera o grupo na edição de IA disponível publicamente. Mascaramento, rastreamento de movimento, super câmera lenta e gradação de cores se beneficiam da assistência da IA. Este é um serviço baseado em assinatura, por isso tem um incentivo extra para ultrapassar os limites.

Em fevereiro, a Runway começou a testar vídeos generativos com sua atualização Gen-1, que permite reestilizar um vídeo com palavras. Um vídeo de uma caminhada na rua se torna um curta animado que parece ser feito com personagens Claymation esculpidos à mão e posados.

A Runway lançou o Gen-1 publicamente hoje e já está testando o Gen-2, eliminando a necessidade de um vídeo de referência. Em breve, o Runway permitirá que você crie um vídeo com um simples prompt de texto.

Picsart

Você pode reconhecer o Picsart como um editor de fotos gratuito, mas também oferece edição de vídeo. Text2Video-Zero é uma ferramenta de pesquisa Picsart que usa o gerador de imagens Stable Diffusion AI para criar vários quadros com o suficiente em comum para parecerem coesos.

Este é um progresso significativo. já que os primeiros experimentos na montagem de imagens de IA como quadros de vídeo produziram cenas caóticas onde todos os detalhes mudavam constantemente. O efeito era atraente, mas desviava a atenção do conteúdo.

Vídeo-P2P

Video-P2P é um projeto de código aberto semelhante ao Runway Gen-1. É preciso entrada de vídeo e usa Stable Diffusion para estilizá-lo com prompts de texto. Os exemplos mostrados parecem bons, com planos de fundo estáveis e consistência nos elementos alterados.

TemporalNet

O TemporalNet é baseado no ControlNet, um avançado gerador de imagens AI que permite mais controle das poses das figuras que aparecem nas imagens.

Os vídeos têm alguma oscilação, mas os resultados são promissores. A ControlNet deu um grande passo em direção à produção de cenas previsíveis, e a TemporalNet pode fornecer um bom método alternativo de criação de vídeos.

Texto para vídeo

Text-to-video é um modelo de IA criado pelo Alibaba. É claro que esse modelo precisa de um pouco mais de trabalho, mas ter mais opções para explorar é sempre bom.

texto para vídeo rápido e mais longo com difusores
você talvez tenha visto recentemente um divertido junky text-to-video do modelo de pesquisa do ModelScope
com difusores, você pode controlar a duração do vídeo – e ajustá-lo em GPUs VRAM smol, incluindo colaboração gratuita. Experimente aqui: pic.twitter.com/mIFkGnGT5V
— poli da arte multimodal (@multimodalart) 22 de março de 2023

Inovação em ritmo acelerado

O ritmo acelerado da inovação da IA é fenomenal. Apenas alguns meses atrás, fomos provocados com vislumbres do potencial de vídeos semelhantes criados em laboratórios de IA. Em 2022, um dos primeiros geradores públicos de vídeo de IA simplesmente sobrepôs pequenas imagens de IA a imagens de arquivo.

Esses métodos da “velha escola”, de alguns meses atrás, são ridículos quando você vê o quanto a IA progrediu em tão pouco tempo.

Recomendações dos editores

Tags: aí Animação de argila Animação por computador aprendizado Artes visuais Captura de movimento chatbot ChatGPT chegaram cibernética ciência Ciência cognitiva Ciência da Computação computação gráfica comunicação conhecimento Difusão estável entretenimento estão evoluindo Fazendo um filme formatos de mídia gerados Gradação de cores gráficos Indústria cinematográfica Informática Inteligência artificial meio da jornada mídia de artes visuais mídia de massa Mídia digital Modelo de texto para imagem neurociência computacional Picsart por Ramos da ciência rapidamente tecnologia tecnologia da informação e Comunicação Tecnologia de mídia de massa Tecnologia digital Tecnologia e Computação Tecnologias emergentes texto para imagem texto para vídeo vídeo Vídeos