11月19日消息,阿里云百煉推出全新RAG框架,全面提升大模型的準確性和可靠性,可解決90%以上幻覺問題,更好地滿足企業級大模型應用場景的需求。
RAG是大模型落地的重要技術,它可以將檢索到的知識和大模型結合,以此優化大模型的生成效果。然而傳統RAG方案容易檢索到與問題相似,但與問題描述不符的難負樣本,從而導致大模型易出現幻覺,例如面對“iPhone 16的參數規格”與“iPhone 16Pro的參數規格”這類極為相似的問題時,大模型容易給出錯誤答案。
為此,阿里云百煉在傳統RAG框架之上,在業界首創雙層幻覺信息過濾框架。在這一全新框架下,大模型在生成回答前,能先對候選信息進行一次全面的深度分析和判斷,自動識別并剔除“難負樣本”,確保所有用于生成的信息高度相關且可靠。具體來說,該框架可通過重排序模型進行第一輪過濾,可過濾70%的通用難負樣本,第二層大模型會進一步過濾剩余30%涵蓋更復雜業務定制規則的樣本。通過雙層幻覺信息過濾框架,可解決90%以上大模型幻覺問題,并且相比單層信息過濾方案,效率大幅提升。

阿里云百煉通過雙層幻覺信息過濾框架,可解決90%以上大模型幻覺問題
阿里云百煉資深算法專家謝朋峻表示:“全新的RAG框架極大地提升了大模型的生成效果,為大模型在復雜場景下的應用開辟了新的可能性,我們希望這一新方案能進一步推動了人工智能技術的發展和應用。”
目前,阿里云百煉可為企業和開發者提供三種模型服務:用戶可直接調用大模型進行推理,例如Qwen、Llama、ChatGLM等主流開源和閉源模型;用戶還可對大模型進行微調和訓練,阿里云百煉提供從數據管理、模型調優、評測到部署的全鏈路模型服務,用戶可彈性按需調用算力,無需關心底層架構;此外,阿里云百煉還支持企業打造RAG應用,用戶可在百煉上輕松創建知識庫,并一鍵開啟RAG,通過Assistant API聯合輸出。
據介紹,阿里云百煉已上線超100款國內外主流大模型,已服務一汽、金山、哈啰集團、國家天文臺等超30萬企業客戶。

