近日,字据SuperCLUE发布的最新一轮中语大模子针织性幻觉测评成果,豆包大模子1.5Pro(Doubao-1.5-pro-32k)以仅4%的幻觉率、96%的准确率排行总榜第一,超越DeepSeek-R1、DeepSeek-V3、Gemini-2.5-pro、GPT-4o-latest等中外主流模子。
在涵盖文本纲目、多文本问答、对话补全等关键任务的细分评测中,豆包大模子1.5Pro也均位列众人第一,在阅读理受命务中,其准确率则为国内最高,展现出在复杂道话交融与生成场景中的出色才气。
SuperCLUE由空隙第三方推出,是现时中语大道话模子评测的迫切基准体系。其中SuperCLUE-Faith聚焦中语实质生成经过中的针织性与幻觉适度才气,从文本纲目、阅读交融、多文本问答以及对话补全等角度伸开测评,对象包括国表里总共16款具有代表性的模子,评估成果具备较强公信力与行业参考价值。
现在,豆包大模子眷属已笼罩全模态、全场景,包括大道话模子、深度念念考模子、视觉交融模子、语音大模子,以及图像、视频等视觉大模子,企业不错通过字节高出旗下云工作平台火山引擎使用豆包大模子API工作。其中,豆包大模子1.5Pro基于MoE架构构建并剿袭熟识-推理一体化筹谋念念路,在保证高性能的同期权臣裁减推理本钱。通过激活有限参数收尾对大范畴场景的精确交融与生成,其抽象性能已特出多款超大茁壮预熟识模子。
驱散2025年3月底,豆包大模子日均tokens调用量已特出12.7万亿,是2024年12月的3倍,是一年前刚刚发布时的106倍。IDC敷陈流露,2024年中国公有云大模子调用量激增,火山引擎以46.4%的市集份额位居中国市集第一。
据悉开yun体育网,火山引擎将于6月11日在北京举办FORCE原能源大会,将带来豆包大模子的最新升级施展与才气进化。
声明:新浪网独家稿件,未经授权谢却转载。 -->