A Anthropic acaba de lançar o Cloud 3.7 Sonnet, junto com a versão Cloud Code para desenvolvimento de software. A empresa está afirmando, com bastante convicção, que criou o melhor assistente de programação do planeta. Será que essa ferramenta realmente entrega o que promete? Vamos explorar suas capacidades, fazer testes práticos e analisar se esse novo modelo de IA realmente representa um avanço significativo no desenvolvimento de software assistido por inteligência artificial.
A Anthropic está posicionando o Cloud 3.7 Sonnet como um marco evolutivo na assistência à programação. Segundo os benchmarks da empresa, o modelo alcança uma impressionante acurácia de 62% em tarefas de codificação, enquanto concorrentes como o GPT-4o da OpenAI, o Claude 3.5 (versão anterior) e o Claude Opus permanecem abaixo dos 50%. Com algumas técnicas de otimização, esse percentual pode chegar a 70%.
A visão da Anthropic para o futuro do Cloud é ambiciosa:
Antes de testar suas habilidades de codificação, é importante verificar como o modelo lida com raciocínio lógico básico. Para isso, realizamos o famoso “teste do copo”, um experimento simples que avalia a capacidade de raciocínio de modelos de IA.
No teste, apresentamos a seguinte situação: “Coloquei um copo em cima da mesa, coloquei um dado dentro do copo, virei o copo de ponta cabeça, e então coloquei o copo em cima do fogão. Onde está o dado?”
Quando testamos o modelo básico (sem o modo Thinking ativado), ele respondeu incorretamente que o dado permaneceria dentro do copo, mesmo após este ser virado de cabeça para baixo. Esta é uma resposta típica de modelos sem capacidade avançada de raciocínio.
Ao utilizar o Cloud 3.7 com o Thinking mode ativado, obtivemos a resposta correta: “O dado está na mesa. Quando você virou o copo de cabeça para baixo, o dado caiu na mesa pela gravidade, e depois disso você pegou apenas o copo e levou para o fogão, mas o dado continuou onde havia caído, que era a mesa.”
Esta diferença demonstra claramente o impacto do recurso de raciocínio avançado no modelo, um aspecto fundamental para tarefas complexas de programação.
O Cloud Code é a nova interface da Anthropic específica para desenvolvimento de software. Para utilizá-la, é necessário ter:
A instalação é simples, utilizando o comando npm install anthropic-cloud
, seguido pelo comando cloud
para iniciar a ferramenta.
Realizamos dois testes práticos para avaliar as capacidades do Cloud 3.7 Sonnet como assistente de programação, utilizando o Cursor (uma IDE que integra o modelo da Anthropic).
No primeiro teste, solicitamos a criação de um jogo Tetris em HTML com algumas funcionalidades específicas como preview de peças e sistema de pontuação. O resultado foi surpreendente – em questão de segundos, o modelo gerou:
O mais impressionante foi que o jogo funcionou perfeitamente na primeira tentativa, com todas as mecânicas clássicas do Tetris implementadas corretamente: rotação de peças, eliminação de linhas, sistema de pontuação e interface responsiva.
No segundo teste, pedimos algo mais desafiador: criar um jogo que mesclasse elementos de Tetris com Bedazzled (um jogo de combinação de cores). Este teste foi inspirado no famoso prompt usado por Elon Musk para testar o Grok.
Inicialmente, houve um problema – o jogo começava com uma tela de “Game Over” que não desaparecia. Após reportarmos o problema, o modelo fez várias alterações no código e conseguiu resolver o bug.
O resultado final foi um jogo criativo que combina:
A capacidade de não apenas resolver o problema inicial, mas também implementar a lógica de jogo complexa sem instruções detalhadas demonstra a sofisticação do modelo para tarefas de codificação criativa.
Existem várias maneiras de experimentar o Cloud 3.7 Sonnet:
Ao criar uma nova conta na plataforma Claude, você recebe créditos gratuitos que podem ser usados para testar o modelo por um ano. Através do Workbench, é possível acessar o Cloud 3.7 Sonnet e ativar o modo Thinking para aproveitar todo o potencial do modelo.
O Cursor é uma IDE que integra nativamente o Cloud 3.7 Sonnet, permitindo testar o modelo para tarefas de programação, como demonstrado nos testes acima.
Para acesso ilimitado a todos os recursos, incluindo o modelo estendido com raciocínio avançado, é necessário assinar o plano Claude Pro, que custa aproximadamente R$110 por mês.
O que vimos nos testes práticos vai além de uma simples assistência de código. O Cloud 3.7 Sonnet demonstra capacidade não apenas de escrever código funcional, mas de:
Essas habilidades sugerem que estamos presenciando uma mudança significativa na forma como o desenvolvimento de software pode ser abordado, com a IA assumindo um papel cada vez mais colaborativo e menos apenas assistencial.
O Cloud 3.7 Sonnet representa um avanço significativo no campo da assistência à programação por IA. Os testes demonstraram que o modelo não só cumpre as promessas básicas, mas supera expectativas em termos de raciocínio lógico e capacidade de criar código funcional desde a primeira tentativa.
Se você é um desenvolvedor buscando aumentar sua produtividade ou alguém interessado em criar software sem experiência extensiva em programação, vale a pena explorar essa tecnologia. Experimente criar uma conta gratuita e utilizar os créditos de teste para ver como o Claude pode transformar sua abordagem à codificação.
Quer continuar aprendendo sobre as mais recentes inovações em IA para programação? Assine nosso newsletter, deixe um comentário compartilhando sua experiência com modelos de IA para codificação, ou experimente replicar alguns dos testes que demonstramos aqui!
Este artigo foi baseado no vídeo abaixo. Se preferir, você pode assistir ao conteúdo original:
A inteligência artificial está passando por uma transformação radical. Enquanto todos falam sobre construir agentes…
O desenvolvimento com inteligência artificial está revolucionando a forma como criamos aplicações, e os servidores…
O YouTube se estabeleceu como a plataforma de conteúdo mais duradoura e lucrativa da internet.…
O YouTube se tornou muito mais do que uma plataforma de entretenimento. Para profissionais e…
A inteligência artificial está redefinindo os limites do que consideramos possível. Em 2025, testemunhamos avanços…
A criação de aplicativos de inteligência artificial sempre foi considerada uma tarefa complexa, reservada apenas…