豆包2.0上线,字节加码春节模型大战

文丨苏扬

编辑丨徐青阳

字节跳动终于凑齐了参与春节模型大战的“全家桶”。

在连续发布Seedance 2.0视频模型、Seedream 5.0 Lite图像模型之后，2月14日，字节跳动宣布推出豆包大模型2.0（Doubao-Seed-2.0）系列。

据了解，豆包2.0系列包含Pro、Lite、Mini三款不同尺寸的通用Agent模型以及专用Code模型。

目前，豆包2.0 Pro已在豆包App、电脑客户端和网页版上线，选择「专家」模式即可对话体验。

字节跳动强调，豆包2.0旨在更好地完成真实世界的复杂任务。

字节跳动表示，豆包2.0 Pro旗舰版取得IMO、CMO数学竞赛和ICPC编程竞赛金牌成绩，在超难数学推理测试集Putnam上的表现也超越了Gemini 3 Pro。

根据已经公布的信息，豆包2.0加强了长尾领域知识覆盖，科学领域知识测试成绩与Gemini 3 Pro和GPT 5.2相当，在跨学科知识应用上也排名前列。

字节跳动表示，通过分析豆包通用模型在MaaS服务中的调用情况，发现最高比例的需求为处理混杂图表、文档等非结构化信息的知识内容，然而企业往往要求模型先做“读得多、想得多”的任务，再进入复杂且专业的流程型工作，对模型的长内容理解和多步任务执行能力要求越来越高。

豆包处理的任务类型分布，非结构化信息占比第一

为此，豆包2.0全面升级多模态理解能力，同时提升了指令遵循和推理表现，并强化了对多约束、多步骤、长链路任务的理解与执行能力，以强化在教育、娱乐、办公等众多场景中的应用能力。

在与GPT-5.2 High、Claude Sonnet 4.5、Gemini 3 Pro High等主流模型的对比测试中，豆包2.0在HLE-Text（搜索代理）、BrowseComp（搜索代理）、MCP-Mark（工具使用）、MultiChallenge（指令遵循）、IMOAnswerBench (no tool)（数学）和SpreadsheetBench Verified（数据分析）六个维度中位居前列，尤其在IMOAnswerBench（86.3）、SpreadsheetBench Verified（79.1）和MultiChallenge（68.3）等任务上表现突出，展现了其在复杂推理、数据分析和指令遵循等方面的能力。

图：Agent及推理能力部分评测成绩

据悉，火山引擎也已上线豆包2.0系列模型API服务，豆包2.0 Pro按“输入长度”区间定价，32k以内的输入定价为3.2元/百万tokens，输出定价为16元/百万tokens，豆包2.0 Lite则主打性价比，综合性能超越两个月前发布的上一代主力模型豆包1.8，百万tokens输入价格仅为0.6元。