🏆 2026 AI 大模型排行榜

基于 LMArena 全球用户盲测投票 · 多维度权威评测

📅 数据更新于 2026 年 1 月 13 日

📝 Text Arena 文本能力排行榜

考察模型在对话、推理、写作等文本任务上的综合表现,是最受关注的通用能力榜单。总投票数超过数百万次。

📊 评测洞察

🥇 冠军 Gemini-3-Pro (Google) - Elo 1490
🚀 黑马 Grok-4.1-Thinking (xAI) - Elo 1477
💡 趋势 Google Gemini 3 系列包揽前三,文本能力进入 Elo 1400+ 时代

💻 WebDev Leaderboard 编程开发排行榜 开发者首选

专门测试模型在网页开发、代码生成、交互应用构建等实际编程任务上的能力,投票数近 10 万次,贴近开发者真实需求。

📊 评测洞察

🥇 冠军 Claude-Opus-4-5-Thinking-32K - Elo 1511
🎯 推荐 Anthropic Claude Opus 系列包揽前两名,开发者首选
⚡ 优势 Claude 在代码逻辑、调试、复杂前端后端集成表现卓越

👁️ Vision Arena 视觉理解排行榜

考察多模态模型对图像的理解、描述、推理能力,总投票超过 58 万次,是视觉大模型的重要风向标。

📊 评测洞察

🥇 冠军 Gemini-3-Pro (Google) - Elo 1302
🏆 统治力 Google Gemini 系列包揽前四名,展现压倒性优势
🔍 强项 图像细节识别、复杂场景理解、OCR 文字提取

🎨 Text-to-Image Arena 文生图排行榜

测试模型根据文字提示生成图像的质量、真实感、风格控制等,总投票高达数百万次,是最热闹的创意领域榜单。

📊 评测洞察

🥇 冠军 GPT-Image-1.5 (OpenAI) - Elo 1243
🌟 惊喜 OpenAI 全新模型意外登顶,超越 Google Gemini
🔓 开源 Flux 2 系列表现强劲,开源社区快速追赶

📈 综合总结

🏆 综合实力最强 Google - Gemini 3 系列在文本、视觉领域全面领先
💻 编程开发之王 Anthropic - Claude Opus 系列在编程领域意外爆发
🎨 创意生成领先 OpenAI - GPT-Image-1.5 在文生图领域夺魁
🚀 快速崛起 xAI - Grok 4.1 系列在文本任务紧追不舍