根據權威評測平臺OpenCompass多模態大模型學術榜單(Multi-modal Academic Leaderboard)最新數據顯示,商湯「日日新 V6.5」(SenseNova-V6.5 Pro)多模態大模型以82.2的綜合成績登頂榜首,領先Gemini 2.5 Pro以及GPT-5等國際頂尖模型。
這一佳績不僅意味著商湯「日日新 V6.5」成為全球最強多模態大模型之一,同時也是商湯在“多模態通用智能”技術戰略下的成果印證。商湯科技聯合創始人、執行董事、首席科學家林達華在《邁向多模態通用智能:商湯的思考》中指出,智能的核心是與外界進行自主交互的能力,多模態信息感知與處理的能力是AGI的核心要求,使AI能像人類一樣,通過視覺、聽覺等多種感官接收并融合信息,實現更深層次的理解與推理,是邁向AGI的必由之路。
商湯「日日新V6.5」正是商湯科技以多模態為技術主軸下的最新成果。在國內率先突破“圖文交錯思維鏈”技術,「日日新V6.5」能夠像人一樣,實現邏輯思維和形象思維的結合,可將部分思考過程轉化為圖形化表達,具備真正的多模態思考能力,成為國內首個擁有形象思維,實現圖文交錯思維的商業級大模型。
同時,憑借以思維鏈為載體、強化學習為主要途徑的新范式,「日日新V6.5」能夠在“生成-驗證-學習”的算法閉環中持續改進自身的思維,推理性能大幅提升,其中在數理、代碼、GUI操作、圖表分析、高階任務等維度的提升尤為顯著。
商湯「日日新V6.5」還通過架構更新,采用輕量化的視覺編碼器,同時加深MLLM主干網絡,在保證同樣性能的前提下,實現3倍以上的效率提升,使性能成本曲線顯著優化,效費比優于Gemini 2.5等國際模型。
在以多模態通向通用人工智能(AGI)的過程,商湯科技以“基礎設施-模型-應用”三位一體的總體戰略,致力于打造業界領先的通用多模態大模型,并在真實場景牽引下,構建端到端的產品技術競爭力。以不斷進化的多模態大模型能力為基礎,商湯科技持續推動多模態AI從數字空間走入真實的物理世界,在真實場景中提供端到端的價值。
OpenCompass大模型開放評測體系是上海人工智能實驗室推出的一站式、大模型評估平臺,致力于提供公平、開源、可復現的評測標準,覆蓋了語言、多模、安全、具身智能、金融與醫療等多個方面通用能力和垂類領域評測,是對大模型真實能力各個維度進行全面診斷的專業綜合榜單。多模態模型公開學術榜單精選國內外具有廣泛影響力的開源學術評測集,對行業多模態模型進行評測,采用主客觀評測相結合的評測手段,運用了CircularEval、LLM-as-a-Judge等策略,被業界視為反映大模型“應用價值”的重要參考。

