123cha:提供安全、无毒的游戏、软件资源下载!

您当前位置: 首页 · 游戏攻略 · 正文

大模型视觉测评结果揭晓:Gemini一骑绝尘 豆包成功闯入前三名

作者:LSY 发布时间:2026-01-04 15:14:18

近日,SuperCLUE-VLM多模态视觉语言基准测评12月总榜已正式发布。谷歌的Gemini-3-pro以83.64分的成绩遥遥领先,字节跳动旗下的豆包大模型则凭借73.15分成功跻身前三,这一表现充分彰显了国内大模型的强劲竞争力。

此次测评从基础认知、视觉推理、视觉应用三个维度对多模态大模型进行评估。

榜首Gemini-3-pro在三项细分指标中均表现突出,基础认知得分89.01、视觉推理82.82、视觉应用79.09,全面领先其他模型。

大模型视觉测评结果揭晓:Gemini一骑绝尘豆包成功闯入前三名

国内阵营中,商汤科技SenseNova V6.5 Pro以75.35分位居第二,字节跳动的豆包视觉版紧随其后,其基础认知得分82.70,甚至超过部分国际竞品,仅在视觉推理环节稍显短板。

百度ERNIE-5.0-Preview、阿里巴巴Qwen3-vl等国内模型也进入前五,其中Qwen3-vl是榜单中首个开源且总分超70的模型。

在国际头部模型的评分中,Anthropic旗下的Claude-opus-4-5取得了71.44分的成绩,而OpenAI的GPT-5.2(high)仅获得69.16分,在排名上处于相对靠后的位置。

大模型视觉测评结果揭晓:Gemini一骑绝尘豆包成功闯入前三名

热门游戏
精选攻略
查看更多 +
火爆手游榜
  1. 1 上号神器最新版

    上号神器最新版

    2026-04-04更新
    查看
  2. 2 北北北砂漫画

    北北北砂漫画

    2026-04-04更新
    查看
  3. 3 双生幻想国际服

    双生幻想国际服

    2026-04-04更新
    查看
  4. 4 ProjectPlaytime

    ProjectPlaytime

    2026-04-04更新
    查看
  5. 5 欧洲战场二战英雄

    欧洲战场二战英雄

    2026-04-04更新
    查看
  6. 6 FNaF4代娘化版

    FNaF4代娘化版

    2026-04-04更新
    查看
  7. 7 ZerowakeGATES

    ZerowakeGATES

    2026-04-04更新
    查看
  8. 8 Namaiki

    Namaiki

    2026-04-04更新
    查看
  9. 9 奈的养成日记

    奈的养成日记

    2026-04-04更新
    查看
  10. 10 保卫萝卜单机版

    保卫萝卜单机版

    2026-04-04更新
    查看
专题推荐
更多