SuperCLUE 多模態(tài)視覺(jué)評測榜:文心 4.5 Turbo 總分并列國內第一

2025-08-28 20:48:44 來(lái)源: IT之家

  8 月 29 日消息,中文多模態(tài)視覺(jué)語(yǔ)言模型測評基準(SuperCLUE-VLM)8 月榜單正式發(fā)布,百度 ERNIE-4.5-Turbo-VL 多模態(tài)大模型以 66.47 分的成績(jì)并列位居國內模型第一,在真實(shí)場(chǎng)景任務(wù)下的領(lǐng)先優(yōu)勢明顯。

  本次評估覆蓋 Claude-Opus-4.1、Gemini-2.5-Pro、GPT-5 (high)、ERNIE-4.5-Turbo-VL、Doubao-Seed-1.6-thinking、hunyuan-t1-vision、Qwen-V1-Max-Latest 等國內外 15 款多模態(tài)模型;谥形膱(chǎng)景特點(diǎn),SuperCLUE-VLM 圍繞基礎認知、視覺(jué)推理和視覺(jué)應用三大核心維度進(jìn)行評測,全面考察模型在真實(shí)任務(wù)場(chǎng)景下的能力。

  測評結果顯示,Gemini-2.5-Pro 以總分 74.99 分領(lǐng)先,OpenAI GPT-5 (high) 以總分 68.59 分位居第二,百度 ERNIE-4.5-Turbo-VL-32k-preview 以總分 66.47 分并列國內模型第一。有分析人士點(diǎn)評,文心大模型在多模態(tài)領(lǐng)域的多維度領(lǐng)先優(yōu)勢十分突出。ERNIE-4.5-Turbo-VL 等國內其他頭部模型在視覺(jué)推理、視覺(jué)應用等高階任務(wù)上的顯著(zhù)進(jìn)步,凸顯了中國在多模態(tài)大模型領(lǐng)域的競爭潛力。

  SuperCLUE-VLM 多模態(tài)視覺(jué)語(yǔ)言基準評測總榜

  據早前公開(kāi)報道,6 月 30 日百度開(kāi)源文心 4.5 系列 10 款模型,其中 ERNIE-4.5-VL 視覺(jué)語(yǔ)言模型(ERNIE-4.5-VL-28B-A3B;ERNIE-4.5-VL-424B-A47B)具備復雜的圖文與視頻理解能力,支持超過(guò) 100 種語(yǔ)言交互,其跨模態(tài)能力覆蓋文檔處理、視頻管理、學(xué)習解題等核心任務(wù)場(chǎng)景。

  作為國內最早投入大模型產(chǎn)研的企業(yè),百度依托“芯片-框架-模型-應用”的全棧自研體系,持續推動(dòng)文心大模型能力進(jìn)化。得益于飛槳文心的聯(lián)合優(yōu)化,文心大模型的能力拓展和效率提升。截至目前,飛槳文心開(kāi)發(fā)者數量已超過(guò) 2185 萬(wàn),服務(wù)超過(guò) 67 萬(wàn)家企業(yè),創(chuàng )建的模型達到 110 萬(wàn)。

關(guān)注同花順財經(jīng)(ths518),獲取更多機會(huì )

0

+1
  • 北信源
  • 兆易創(chuàng )新
  • 科森科技
  • 卓翼科技
  • 天融信
  • 吉視傳媒
  • 御銀股份
  • 中油資本
  • 代碼|股票名稱(chēng) 最新 漲跌幅