(6月20日,上海)近日,商湯科技與云知聲智能科技股份有限公司(以下簡稱“云知聲”)正式簽署戰略合作協議。雙方將基于各自領域的技術積累與資源優勢,圍繞多模態大模型、行業應用、智能終端等核心領域展開深度合作,探索大模型在垂直行業的落地實踐。通過模型能力的深度融合,雙方將在語音與視覺等多模態交互方面協同創新,為行業客戶提供更自然、更高效的智能交互體驗,加速智能技術的規模化落地,推動多行業的智能化升級。

云知聲創始人&CEO黃偉(后排左二)和商湯科技董事長&CEO徐立(后排左三)見證簽約
隨著AI的快速發展與深度賦能各行各業,多模態模型逐漸邁向舞臺中央,通過更廣泛、更深度的信息交互與整合,可以為用戶更完整的場景價值。從海外的Gemini 2.5、GPT 4.5到國內商湯日日新大模型、云知聲山海大模型等,均可見產業界持續提升原生多模態能力。讓大模型能夠有思考,具備處理復雜信息和解決復雜問題能力,融入真實的業務應用;同時,讓大模型以更有親和力的方式與人交互,與人共情、實時互動,是大模型發展和商業落地并行的兩個關鍵方向。
作為亞洲領先的人工智能軟件公司,商湯科技專注于原創技術研發,不斷增強行業領先的多模態、多任務人工智能能力,涵蓋感知智能、自然語言處理、智慧內容生成等關鍵技術領域,同時包含AI芯片、AI傳感器及AI算力基礎設施在內的關鍵能力。今年4月,商湯重磅推出全新升級的原生多模態通用大模型日日新 SenseNova V6,通過多模態長思維鏈訓練、全局記憶、強化學習的技術突破,形成領先的多模態推理能力,并突破成本邊界。日日新V6采用了 6000 億參數的混合專家架構,實現文本、圖像和視頻的原生融合,并可進行視頻-語音交融的端到端輸入輸出,在純文本和多模態任務上都表現出優秀的綜合性能。目前,日日新大模型已廣泛賦能金融、智能汽車、具身智能、AI教育、智能辦公等領域。
云知聲成立于2012年,是最早將深度學習算法應用于商業語音識別的公司之一,也是國內AGI技術的先行者,始終深耕AI領域前沿,逐步構建起涵蓋大模型技術、多模態交互技術、AI芯片、領域知識圖譜等在內的全棧式AI硬核技術體系,并成功將技術成果應用于醫療、交通、家居等多個實體場景。其自主研發的“山海大模型”通用能力位居世界前列,在醫療等領域的專業能力更是達到世界領先水平,同時還拓展出文生圖、音圖問答等多模態交互能力,大幅拓寬應用邊界。以“山海大模型”為核心,云知聲打造的行業智能體已廣泛應用于輔助診療、醫保核賠、智慧座艙等垂直領域。