成人午夜激情影院,小视频免费在线观看,国产精品夜夜嗨,欧美日韩精品一区二区在线播放

阿里云通義千問開源第二波!大規模視覺語言模型Qwen-VL上線魔搭社區

2023-08-25 14:14:45來源:威易網作者:

通義千問開源第二波!8月25日消息,阿里云推出大規模視覺語言模型Qwen-VL,一步到位、直接開源。Qwen-VL以通義千問70億參數模型Qwen-7B為基座語言模型研發,支持圖文輸入,具備多模態信息理解能力。在主流的多模態任

通義千問開源第二波!8月25日消息,阿里云推出大規模視覺語言模型Qwen-VL,一步到位、直接開源。Qwen-VL以通義千問70億參數模型Qwen-7B為基座語言模型研發,支持圖文輸入,具備多模態信息理解能力。在主流的多模態任務評測和多模態聊天能力評測中,Qwen-VL取得了遠超同等規模通用模型的表現。

Qwen-VL是支持中英文等多種語言的視覺語言(Vision Language,VL)模型,相較于此前的VL模型,Qwen-VL除了具備基本的圖文識別、描述、問答及對話能力之外,還新增了視覺定位、圖像中文字理解等能力。

\

多模態是通用人工智能的重要技術演進方向之一。業界普遍認為,從單一感官的、僅支持文本輸入的語言模型,到“五官全開”的,支持文本、圖像、音頻等多種信息輸入的多模態模型,蘊含著大模型智能躍升的巨大可能。多模態能夠提升大模型對世界的理解程度,充分拓展大模型的使用場景。

視覺是人類的第一感官能力,也是研究者首先想賦予大模型的多模態能力。繼此前推出M6、OFA系列多模態模型之后,阿里云通義千問團隊又開源了基于Qwen-7B的大規模視覺語言模型(Large Vision Language Model, LVLM)Qwen-VL。Qwen-VL及其視覺AI助手Qwen-VL-Chat均已上線ModelScope魔搭社區,開源、免費、可商用。

用戶可從魔搭社區直接下載模型,也可通過阿里云靈積平臺訪問調用Qwen-VL和Qwen-VL-Chat,阿里云為用戶提供包括模型訓練、推理、部署、精調等在內的全方位服務。

\

Qwen-VL可用于知識問答、圖像標題生成、圖像問答、文檔問答、細粒度視覺定位等場景。

比如,一位不懂中文的外國游客到醫院看病,不知怎么去往對應科室,他拍下樓層導覽圖問Qwen-VL“骨科在哪層”“耳鼻喉科去哪層”,Qwen-VL會根據圖片信息給出文字回復,這是圖像問答能力;再比如,輸入一張上海外灘的照片,讓Qwen-VL找出東方明珠,Qwen-VL能用檢測框準確圈出對應建筑,這是視覺定位能力。

Qwen-VL是業界首個支持中文開放域定位的通用模型,開放域視覺定位能力決定了大模型“視力”的精準度,也即,能否在畫面中精準地找出想找的事物,這對于VL模型在機器人操控等真實應用場景的落地至關重要。

\

\

Qwen-VL以Qwen-7B為基座語言模型,在模型架構上引入視覺編碼器,使得模型支持視覺信號輸入,并通過設計訓練過程,讓模型具備對視覺信號的細粒度感知和理解能力。Qwen-VL支持的圖像輸入分辨率為448,此前開源的LVLM模型通常僅支持224分辨率。在Qwen-VL 的基礎上,通義千問團隊使用對齊機制,打造了基于LLM的視覺AI助手Qwen-VL-Chat,可讓開發者快速搭建具備多模態能力的對話應用。

在四大類多模態任務(Zero-shot Caption/VQA/DocVQA/Grounding)的標準英文測評中,Qwen-VL取得了同等尺寸開源LVLM的最好效果。為了測試模型的多模態對話能力,通義千問團隊構建了一套基于GPT-4打分機制的測試集“試金石”,對Qwen-VL-Chat及其他模型進行對比測試,Qwen-VL-Chat在中英文的對齊評測中均取得了開源LVLM最好結果。

8月初,阿里云開源通義千問70億參數通用模型Qwen-7B和對話模型Qwen-7B-Chat,成為國內首個加入大模型開源行列的大型科技企業。通義千問開源模型剛一上線就廣受關注,當周沖上HuggingFace趨勢榜單,不到一個月在GitHub收獲3400多星,模型累計下載量已突破40萬。

 

開源地址:

ModelScope魔搭社區:

Qwen-VL    https://modelscope.cn/models/qwen/Qwen-VL/summary

Qwen-VL-Chat    https://modelscope.cn/models/qwen/Qwen-VL-Chat/summary

模型體驗:https://modelscope.cn/studios/qwen/Qwen-VL-Chat-Demo/summary

HuggingFace: 

Qwen-VL   https://huggingface.co/Qwen/Qwen-VL

Qwen-VL-Chat   https://huggingface.co/Qwen/Qwen-VL-Chat

GitHub:

https://github.com/QwenLM/Qwen-VL

技術論文地址:

https://arxiv.org/abs/2308.12966

主站蜘蛛池模板: 清丰县| 容城县| 益阳市| 兴海县| 灵丘县| 江油市| 那曲县| 西藏| 平度市| 左权县| 吉首市| 孟津县| 漳浦县| 库伦旗| 新龙县| 白河县| 沂源县| 炎陵县| 金乡县| 唐山市| 隆安县| 墨江| 建平县| 武城县| 禄丰县| 泊头市| 静海县| 改则县| 施秉县| 山丹县| 丰都县| 如东县| 兰州市| 夹江县| 厦门市| 轮台县| 大冶市| 昌平区| 会同县| 宝鸡市| 中超|