O mundo da produção de conteúdo digital está passando por uma transformação radical. A China acaba de apresentar o que está sendo chamado de “o mais poderoso gerador de vídeo por IA do planeta”, atraindo mais de 22 milhões de usuários em tempo recorde. Enquanto isso, gigantes como ByteDance desenvolvem secretamente óculos inteligentes com IA para competir com a Meta, e novas tecnologias de sincronização labial estão se tornando tão realistas que chegam a ser perturbadoras. Estamos testemunhando uma revolução completa na forma como criamos, consumimos e interagimos com conteúdo visual. Neste artigo, vamos explorar as últimas inovações em IA para vídeo e como elas estão redefinindo o futuro da criação de conteúdo.
A Quihow, uma das maiores plataformas de vídeos curtos da China e principal rival da ByteDance (dona do TikTok) em seu mercado doméstico, recentemente lançou o Cling AI 2, uma versão atualizada de seu modelo de geração de vídeo. A empresa não economiza em superlativos, chamando-o de “o mais poderoso do mundo” – uma afirmação ousada, mas que vem com números impressionantes para sustentá-la.
De acordo com Guy Kun, vice-presidente sênior da Quihow, o Cling AI já acumulou mais de 22 milhões de usuários globais, que coletivamente geraram mais de 168 milhões de clipes de vídeo e impressionantes 344 milhões de imagens. Esses números são verdadeiramente notáveis e explicam a confiança da empresa em seu produto.
O Cling AI 2 traz uma série de aprimoramentos em relação à versão anterior, incluindo:
Um dos principais diferenciais do Cling AI 2 é o impacto visual do conteúdo final, característica crucial no competitivo mundo dos vídeos curtos, onde capturar a atenção do espectador nos primeiros segundos é fundamental.
Segundo a Artificial Analysis, um serviço independente que testa e classifica modelos de IA, a geração anterior do Cling já ocupava uma posição de destaque em desempenho de conversão de imagem para vídeo, ficando atrás apenas do V2 do Google DeepMind em tarefas de texto para vídeo. Esta nova atualização parece estar ampliando ainda mais essa vantagem competitiva.
Não é possível falar sobre IA na China sem mencionar o intenso ambiente competitivo entre gigantes como ByteDance, Alibaba, Tencent e startups especializadas como Zepu AI e Shengshu Tech. Cada uma dessas empresas tem investido pesadamente no desenvolvimento de modelos e recursos de IA cada vez mais avançados.
Como Guy Kun descreve, este ambiente força todos a inovarem constantemente, sob o risco de perderem espaço para o próximo grande concorrente. A ByteDance tem suas próprias ofertas, a Alibaba está desenvolvendo novidades em seus laboratórios, a Tencent intensificou sua pesquisa em IA, e unicórnios menores como a Zepu AI têm feito avanços significativos, inclusive planejando uma oferta pública inicial (IPO) neste ano após sucessos como o Deepseek.
Recentemente, a Quihow anunciou o projeto NextG, oferecendo financiamento, tecnologia e suporte promocional para artistas. O objetivo é ajudar criadores a produzir conteúdo com qualidade cinematográfica, presumivelmente utilizando o Cling AI 2 ou outras tecnologias em desenvolvimento.
O modelo de negócios adotado por essas ferramentas de vídeo com IA segue uma abordagem interessante. Em vez de oferecer tudo gratuitamente, muitas delas utilizam o modelo “freemium”, onde recursos básicos são disponibilizados sem custo, mas funções avançadas como maior resolução, processamento mais rápido ou ferramentas de edição mais sofisticadas são oferecidas mediante assinatura premium.
Esta estratégia, já utilizada por muitos chatbots chineses, faz sentido também para o segmento de vídeo. Os usuários casuais apreciam ferramentas gratuitas, enquanto criadores profissionais não se importam em pagar por recursos avançados que os ajudem a se destacar nas plataformas sociais lotadas. É uma situação vantajosa tanto para as empresas quanto para os usuários.
Enquanto a Quihow avança com o Cling AI 2, a ByteDance parece estar expandindo seu território para além dos vídeos curtos, trabalhando no desenvolvimento de óculos inteligentes com IA para competir diretamente com a Meta.
Segundo fontes do setor, a ByteDance está em negociações com fornecedores para desenvolver óculos que ofereçam captura de vídeo e imagem de qualidade sem comprometer drasticamente a duração da bateria – um dos maiores desafios no desenvolvimento de dispositivos vestíveis.
Este projeto teria começado no último ano, com equipes já trabalhando ativamente nas especificações, recursos e definição de preços. A colaboração da ByteDance com a Qualcomm, anunciada durante o MWC 2025, para um headset de VR de próxima geração, foi interpretada por muitos como um sinal de que a empresa pretende ir além dos vídeos curtos em smartphones.
Não podemos esquecer que a ByteDance adquiriu a Pico em 2021, o que certamente trouxe conhecimento valioso em fabricação de dispositivos de realidade virtual. A empresa parece estar construindo todo um ecossistema de hardware, de headsets VR a óculos inteligentes com IA, posicionando-se para competir diretamente com a Meta no espaço de wearables e realidade estendida.
Outro projeto da ByteDance que está chamando atenção é o Omnihuman 1, uma ferramenta avançada de sincronização labial disponível na plataforma Draina. O grande diferencial desta tecnologia é o nível extraordinário de realismo alcançado a partir de uma única imagem de referência.
Com apenas uma foto de uma pessoa, a IA consegue gerar um vídeo alinhando os movimentos labiais de forma extremamente precisa com qualquer áudio, seja texto convertido em fala ou áudio personalizado carregado pelo usuário. Isso representa uma enorme vantagem para criadores que desejam produzir desde esquetes cômicas até narrações sérias, sem a necessidade de gravar extensas filmagens reais.
O Omnihuman 1 se destaca pelo excelente desempenho em close-ups e cenas de canto, notoriamente difíceis para IA reproduzir de forma convincente. Enquanto outras ferramentas de sincronização labial podem falhar quando a câmera se aproxima da boca de uma pessoa ou não conseguem lidar com as complexidades de performances musicais, a ByteDance afirma que o Omnihuman 1 estabelece um novo padrão para este tipo de conteúdo.
No entanto, a ferramenta não é perfeita. Seu melhor desempenho ocorre com fundos estáticos, então se você precisa de mudanças dinâmicas de cena ou múltiplos personagens se movimentando, talvez não seja a opção ideal. Mas para vídeos de pessoas falando diretamente para a câmera, performances de canto ou qualquer cenário em close-up, é impressionantemente eficaz.
Com o aumento da competitividade no setor de IA para sincronização labial, outras empresas também desenvolveram suas próprias soluções. A Hedra, por exemplo, é conhecida por seu bom desempenho em comandos de cena e movimentos dinâmicos, algo que o Omnihuman 1 não faz com a mesma eficácia. A Hedra tenta dirigir cenas inteiras com personagens se movimentando ou executando determinadas tarefas, mas não lida tão bem com perfis laterais e canto quanto o Omnihuman 1.
Já o Clink AI concentra-se na geração de fundos super dinâmicos, mas fica para trás em termos de precisão de sincronização labial. Se o objetivo é ter um fundo impressionante ou transições elaboradas, o Clink AI pode ser a escolha certa, mas provavelmente haverá um sacrifício no realismo do alinhamento entre a boca e o áudio.
Estamos vivendo um momento emocionante na criação de conteúdo digital, comparável aos primeiros dias da internet. Tudo está evoluindo em velocidade impressionante. O Cling AI 2 da Quihow já conta com milhões de usuários, enquanto a ByteDance desenvolve óculos inteligentes para competir com a Meta e aprimora tecnologias de sincronização labial com o Omnihuman 1.
Quão longe estamos de um mundo onde a maioria dos vídeos que assistimos serão completamente gerados por IA? Ou de substituirmos nossos smartphones por óculos inteligentes? A revolução está apenas começando, e as possibilidades são virtualmente infinitas.
Quer se manter na vanguarda dessas transformações? Experimente algumas dessas ferramentas de IA hoje mesmo e comece a incorporá-las em seus projetos criativos. O futuro da criação de conteúdo está ao seu alcance – basta dar o primeiro passo.
Este artigo foi baseado no vídeo abaixo. Se preferir, você pode assistir ao conteúdo original:
A inteligência artificial está passando por uma transformação radical. Enquanto todos falam sobre construir agentes…
O desenvolvimento com inteligência artificial está revolucionando a forma como criamos aplicações, e os servidores…
O YouTube se estabeleceu como a plataforma de conteúdo mais duradoura e lucrativa da internet.…
O YouTube se tornou muito mais do que uma plataforma de entretenimento. Para profissionais e…
A inteligência artificial está redefinindo os limites do que consideramos possível. Em 2025, testemunhamos avanços…
A criação de aplicativos de inteligência artificial sempre foi considerada uma tarefa complexa, reservada apenas…