Comparativo de Performance - 216/216 Modelos Avaliados
📅 Última atualização: 28/07/2025
Descubra o ranking LLMs mais atualizado e abrangente da internet! Nossa plataforma oferece uma análise detalhada dos modelos de IA mais avançados do mercado, incluindo avaliações do renomado LLM Arena e outras métricas essenciais para desenvolvedores e pesquisadores.
Este ranking de modelos de IA utiliza dados consolidados de múltiplas fontes, incluindo o famoso LLM Arena, para fornecer uma visão abrangente do desempenho dos Large Language Models. Avaliamos cada modelo IA em 8 categorias fundamentais:
Avaliação global do desempenho do modelo em diversas tarefas
Capacidade de gerar e analisar código em múltiplas linguagens
Resolução de problemas matemáticos e raciocínio lógico
Capacidade de produzir conteúdo criativo e original
Os modelos LLM que lideram nosso ranking demonstram excelência consistente em múltiplas dimensões. O Gemini 2.5 Pro da Google mantém a primeira posição, seguido pelos poderosos modelos O3 da OpenAI e ChatGPT-4o. Estes LLMs representam o estado da arte em inteligência artificial.
Navegue facilmente por nosso ranking LLMs usando a interface intuitiva abaixo. No desktop, você pode ver todos os modelos IA em uma tabela completa. No mobile, utilizamos cards otimizados com funcionalidade "mostrar mais" para uma experiência superior. Use as medalhas 🥇🥈🥉 para identificar rapidamente os top performers em cada categoria.
# | Modelo | Geral | Prompts Difíceis | Programação | Matemática | Escrita Criativa | Seguir Instruções | Consultas Longas | Multi-turno |
---|---|---|---|---|---|---|---|---|---|
1 | gemini-2.5-pro | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
2 | o3-2025-04-16 | 1 | 1 | 1 | 1 | 4 | 2 | 5 | 4 |
3 | chatgpt-4o-latest-20250326 | 2 | 2 | 1 | 7 | 2 | 2 | 1 | 1 |
4 | gpt-4.5-preview-2025-02-27 | 3 | 3 | 1 | 4 | 2 | 1 | 2 | 1 |
5 | grok-4-0709 | 3 | 3 | 2 | 1 | 2 | 2 | 2 | 4 |
6 | kimi-k2-0711-preview | 5 | 4 | 5 | 4 | 8 | 8 | 7 | 4 |
7 | claude-opus-4-20250514-thinking-16k | 6 | 3 | 1 | 4 | 2 | 1 | 1 | 4 |
8 | deepseek-r1-0528 | 6 | 4 | 5 | 5 | 6 | 8 | 9 | 9 |
9 | claude-opus-4-20250514 | 6 | 4 | 1 | 4 | 2 | 2 | 1 | 4 |
10 | grok-3-preview-02-24 | 6 | 6 | 8 | 14 | 4 | 7 | 5 | 7 |
11 | gemini-2.5-flash | 6 | 7 | 15 | 3 | 2 | 7 | 5 | 9 |
12 | gpt-4.1-2025-04-14 | 6 | 4 | 6 | 16 | 4 | 7 | 3 | 4 |
13 | claude-sonnet-4-20250514-thinking-32k | 10 | 4 | 1 | 4 | 6 | 4 | 2 | 4 |
14 | o4-mini-2025-04-16 | 12 | 12 | 10 | 4 | 19 | 17 | 21 | 12 |
15 | qwen3-235b-a22b-no-thinking | 12 | 8 | 5 | 5 | 12 | 14 | 10 | 7 |
16 | o1-2024-12-17 | 13 | 9 | 11 | 7 | 11 | 8 | 9 | 17 |
17 | deepseek-v3-0324 | 13 | 13 | 8 | 19 | 6 | 14 | 13 | 4 |
18 | deepseek-r1 | 13 | 9 | 8 | 4 | 11 | 8 | 13 | 7 |
19 | claude-sonnet-4-20250514 | 13 | 11 | 7 | 7 | 8 | 8 | 5 | 7 |
20 | o1-preview | 17 | 17 | 17 | 13 | 15 | 15 | 19 | 14 |
21 | mistral-medium-2505 | 17 | 16 | 15 | 27 | 13 | 19 | 15 | 10 |
22 | claude-3-7-sonnet-20250219-thinking-32k | 17 | 11 | 11 | 12 | 7 | 7 | 5 | 10 |
23 | hunyuan-turbos-20250416 | 17 | 18 | 18 | 17 | 11 | 19 | 15 | 10 |
24 | minimax-m1 | 19 | 21 | 18 | 2 | 27 | 24 | 21 | 27 |
25 | gpt-4.1-mini-2025-04-14 | 23 | 19 | 14 | 26 | 19 | 17 | 15 | 12 |
26 | qwen2.5-max | 23 | 23 | 27 | 16 | 17 | 22 | 16 | 21 |
27 | qwen3-235b-a22b | 23 | 18 | 11 | 4 | 32 | 22 | 20 | 17 |
28 | claude-3-7-sonnet-20250219 | 24 | 21 | 16 | 21 | 12 | 17 | 9 | 11 |
29 | gemini-2.0-flash-001 | 24 | 30 | 34 | 25 | 24 | 26 | 25 | 27 |
30 | claude-3-5-sonnet-20241022 | 25 | 21 | 17 | 33 | 15 | 20 | 17 | 17 |
31 | o3-mini-high | 25 | 15 | 13 | 7 | 35 | 19 | 21 | 30 |
32 | gemma-3-27b-it | 27 | 31 | 34 | 36 | 19 | 28 | 23 | 27 |
33 | grok-3-mini-high | 29 | 29 | 32 | 10 | 25 | 22 | 21 | 34 |
34 | deepseek-v3 | 31 | 35 | 32 | 42 | 19 | 28 | 21 | 22 |
35 | grok-3-mini-beta | 31 | 30 | 30 | 15 | 27 | 23 | 25 | 28 |
36 | mistral-small-2506 | 31 | 30 | 20 | 26 | 25 | 32 | 25 | 21 |
37 | hunyuan-turbos-20250226 | 32 | 24 | 22 | 36 | 35 | 22 | 21 | 27 |
38 | gemini-2.0-flash-lite-preview-02-05 | 33 | 33 | 44 | 36 | 25 | 35 | 34 | 37 |
39 | gemini-1.5-pro-002 | 33 | 35 | 44 | 35 | 17 | 31 | 29 | 37 |
40 | qwen3-32b | 33 | 28 | 15 | 4 | 34 | 28 | 21 | 28 |
41 | command-a-03-2025 | 33 | 32 | 33 | 47 | 28 | 32 | 27 | 27 |
42 | qwen-plus-0125 | 33 | 32 | 32 | 33 | 34 | 31 | 25 | 27 |
43 | llama-3.1-nemotron-ultra-253b-v1 | 33 | 22 | 15 | 6 | 25 | 22 | 29 | 27 |
44 | glm-4-plus-0111 | 34 | 46 | 48 | 45 | 34 | 39 | 35 | 31 |
45 | gemma-3-12b-it | 34 | 38 | 51 | 35 | 24 | 33 | 25 | 27 |
46 | hunyuan-turbo-0110 | 34 | 31 | 29 | 45 | 35 | 37 | 25 | 30 |
47 | o3-mini | 35 | 29 | 27 | 13 | 45 | 28 | 27 | 34 |
48 | gpt-4o-2024-05-13 | 38 | 46 | 44 | 45 | 28 | 42 | 46 | 34 |
49 | claude-3-5-sonnet-20240620 | 38 | 33 | 32 | 34 | 45 | 33 | 34 | 31 |
50 | o1-mini | 42 | 32 | 32 | 22 | 60 | 33 | 36 | 42 |
51 | llama-3.1-405b-instruct-bf16 | 42 | 45 | 41 | 43 | 45 | 47 | 47 | 34 |
52 | qwq-32b | 42 | 32 | 32 | 23 | 45 | 37 | 40 | 38 |
53 | step-2-16k-exp-202412 | 42 | 38 | 42 | 38 | 21 | 39 | 31 | 42 |
54 | gpt-4o-2024-08-06 | 43 | 56 | 47 | 45 | 33 | 44 | 40 | 38 |
55 | gemini-advanced-0514 | 43 | 56 | 57 | 47 | 25 | 47 | 47 | 41 |
56 | llama-3.3-nemotron-49b-super-v1 | 43 | 29 | 31 | 16 | 35 | 32 | 31 | 29 |
57 | llama-3.1-405b-instruct-fp8 | 45 | 47 | 44 | 43 | 43 | 47 | 52 | 37 |
58 | llama-4-maverick-17b-128e-instruct | 45 | 42 | 37 | 31 | 40 | 44 | 40 | 37 |
59 | qwen3-30b-a3b | 45 | 37 | 34 | 12 | 59 | 44 | 35 | 38 |
O LLM Arena é uma plataforma de avaliação colaborativa onde usuários reais testam e comparam modelos de IA em situações práticas. Nosso ranking LLMs incorpora estes dados para oferecer uma visão mais realista do desempenho dos LLMs.
Segundo nosso ranking de modelos IA, o Gemini 2.5 Pro lidera em performance geral, seguido pelo O3-2025 e ChatGPT-4o. Porém, o "melhor" modelo LLM depende da sua aplicação específica - alguns se destacam em programação, outros em escrita criativa.
Nosso ranking LLMs é atualizado regularmente com dados frescos do LLM Arena e outras fontes confiáveis. A última atualização foi em 28/07/2025, garantindo que você tenha acesso às informações mais recentes sobre modelos de IA.
O Gemini 2.5 Pro da Google domina nosso ranking LLMs com performance excepcional em todas as 8 categorias avaliadas. Ideal para aplicações que exigem versatilidade e precisão.
O mais recente modelo IA da OpenAI mantém posição de destaque no LLM Arena, especialmente forte em raciocínio complexo e programação avançada.
O ChatGPT-4o continua sendo uma referência sólida no ranking de modelos IA, combinando desempenho consistente com ampla disponibilidade para usuários.
Nosso ranking LLMs está em constante evolução. Novos modelos de IA são lançados frequentemente, e mantemos nossa base de dados do LLM Arena sempre atualizada para você tomar as melhores decisões.