学习贯彻党的二十届四中全会精神
华商电讯网
KCMEDIA@ALIYUN.COM

豆包2.0上线,字节加码春节模型大战

来源:中国日报网 编辑:梁真 2026-02-27 21:55:03 阅读量:0

文丨苏扬

编辑丨徐青阳

字节跳动终于凑齐了参与春节模型大战的“全家桶”。

在连续发布Seedance 2.0视频模型、Seedream 5.0 Lite图像模型之后,2月14日,字节跳动宣布推出豆包大模型2.0(Doubao-Seed-2.0)系列。

据了解,豆包2.0系列包含Pro、Lite、Mini三款不同尺寸的通用Agent模型以及专用Code模型。

目前,豆包2.0 Pro已在豆包App、电脑客户端和网页版上线,选择「专家」模式即可对话体验。

字节跳动强调,豆包2.0旨在更好地完成真实世界的复杂任务。

字节跳动表示,豆包2.0 Pro旗舰版取得IMO、CMO数学竞赛和ICPC编程竞赛金牌成绩,在超难数学推理测试集Putnam上的表现也超越了Gemini 3 Pro。

根据已经公布的信息,豆包2.0加强了长尾领域知识覆盖,科学领域知识测试成绩与Gemini 3 Pro和GPT 5.2相当,在跨学科知识应用上也排名前列。

字节跳动表示,通过分析豆包通用模型在MaaS服务中的调用情况,发现最高比例的需求为处理混杂图表、文档等非结构化信息的知识内容,然而企业往往要求模型先做“读得多、想得多”的任务,再进入复杂且专业的流程型工作,对模型的长内容理解和多步任务执行能力要求越来越高。

豆包处理的任务类型分布,非结构化信息占比第一

为此,豆包2.0全面升级多模态理解能力,同时提升了指令遵循和推理表现,并强化了对多约束、多步骤、长链路任务的理解与执行能力,以强化在教育、娱乐、办公等众多场景中的应用能力。

在与GPT-5.2 High、Claude Sonnet 4.5、Gemini 3 Pro High等主流模型的对比测试中,豆包2.0在HLE-Text(搜索代理)、BrowseComp(搜索代理)、MCP-Mark(工具使用)、MultiChallenge(指令遵循)、IMOAnswerBench (no tool)(数学)和SpreadsheetBench Verified(数据分析)六个维度中位居前列,尤其在IMOAnswerBench(86.3)、SpreadsheetBench Verified(79.1)和MultiChallenge(68.3)等任务上表现突出,展现了其在复杂推理、数据分析和指令遵循等方面的能力。

图:Agent及推理能力部分评测成绩

据悉,火山引擎也已上线豆包2.0系列模型API服务,豆包2.0 Pro按“输入长度”区间定价,32k以内的输入定价为3.2元/百万tokens,输出定价为16元/百万tokens,豆包2.0 Lite则主打性价比,综合性能超越两个月前发布的上一代主力模型豆包1.8,百万tokens输入价格仅为0.6元。

分享到: