阿里云推大规模视觉语言模型开源，支持中英文多种语言_快报

【资料图】

阿里云于8月25日推出了大规模视觉语言模型Qwen-VL，该模型已在ModeScope开源。此前，阿里云已经开源了通用模型Qwen-7B和对话模型Qwen-7B-Chat。Qwen-VL是一款支持中英文等多种语言的视觉语言模型，相较于此前的视觉语言模型，除了具备基本的图文识别、描述、问答及对话能力之外，还新增了视觉定位、图像中文字理解等能力。Qwen-VL以Qwen-7B为基座语言模型，在模型架构上引入视觉编码器，使得模型支持视觉信号输入，该模型支持的图像输入分辨率为448，此前开源的视觉语言模型通常仅支持224分辨率。官方表示，该模型可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景，在主流的多模态任务评测和多模态聊天能力评测中，取得了远超同等规模通用模型的表现。在Qwen-VL的基础上，通义千问团队使用对齐机制，打造了基于语言模型的视觉AI助手Qwen-VL-Chat，可让开发者快速搭建具备多模态能力的对话应用。通义千问团队同时表示，为了测试模型的多模态对话能力，他们构建了一套基于GPT-4打分机制的测试集“试金石”，对Qwen-VL-Chat及其他模型进行对比测试，Qwen-VL-Chat在中英文的对齐评测中均取得了开源视觉语言模型最好结果。

推荐内容

健康养生行业有什么项目？日常养生小妙招有哪些？

幽门螺旋杆菌传染途径有哪些？一人幽门螺杆菌全家传染吗？

面瘫是什么原因引起的？突然面瘫怎么快速恢复？

打嗝不止怎么办？一直频繁打嗝是什么原因？

血糖高的人吃什么食物最好？血糖高早期征兆有哪些？

鼻炎犯了怎么快速缓解？鼻炎和感冒最大的区别是什么？

什么是过午不食减肥法？减肥训练营真的靠谱吗？

百白破是预防什么的？百白破疫苗是灭活的吗？

打呼噜有什么偏方？打呼噜吃什么药可以治好？

纤体梅有副作用吗？纤体梅和酵素梅的区别有哪些？

炒黄芩有什么功效？炒黄芩是热性还是寒性？

手指开裂是怎么回事？手指开裂起硬皮怎么办？

湿疹药膏有哪些？湿疹不去管它会自愈吗？

白萝卜治咳嗽的做法有哪些？白萝卜治寒咳还是热咳？

粉条的热量高吗？减肥期间吃粉条会胖吗？

37.6度能自行退烧吗？低烧不退警惕哪四种疾病？

什么是痉挛型脑瘫？痉挛性脑瘫早期症状有哪些？

香砂养胃丸的功效有哪些？胃病怎么调理最好？

发烧最多不能超过几天？发烧有汗与无汗的区别有哪些？

视力损伤怎么办？轻度近视该怎么缓解？

医保电子凭证和社保卡一样吗？社保卡没下来如何报销？

儿童眼睛保健如何做？小孩近视眼有什么办法治好？

橄榄油能去痘印吗？哪些人不宜吃橄榄油？

消毒液怎么用？稀释的84消毒液对人体有害吗？

巴氏消毒液和84消毒液一样吗？84消毒液不能和什么混合使用？

神经紧张怎么治？先天性神经紧张怎么办？

手上鸡眼是怎么形成的？手鸡眼怎么处理？

医保卡丢了怎么办？社保卡丢了在手机上能补办吗？

尿结石治疗费用要多少钱？尿结石是哪里疼？

直肠癌早期的五大症状有哪些？直肠癌的死亡率高吗？

乙醇是什么？乙醇消毒液的正确使用方法是怎样的？

中老年人怎么减肥？肚子上的赘肉如何减？

过敏性鼻炎偏方有哪些？过敏性鼻炎是阳气不足吗？

五脏排毒方法有哪些？哪个脏腑是给身体排毒的？

血脂高的原因有哪些？血脂高最忌讳吃什么食物？

豆汁和豆浆的区别有哪些？豆汁和豆浆哪个营养价值高？

柿子的热量高吗？吃完柿子千万别碰哪些食物？

视疲劳是什么意思？怎么判断自己是不是视疲劳？

农村合作医疗怎么报销？农村合作医疗能报销多少钱？

人体八大系统包含什么？人体最大的器官是哪个？

过敏性鼻炎怎么治最有效？如何判断自己有没有鼻炎？

一天喝多少毫升的水最好？晚上可以喝蜂蜜水吗？

食物中毒后吃什么？食物中毒能自己恢复吗？

腰间盘突出吃什么好？腰突自愈的最佳方法是什么？

粽叶需要泡多久才能包粽子？干粽叶怎么泡最快？

结肠癌治疗方法有哪些？为什么说结肠癌是幸运癌？

降压食物之王是什么？高血压患者忌什么水果?

茯苓粉怎么吃？茯苓一般服用多长时间见效？

食品添加剂使用标准是怎样的？常用食品添加剂有哪些？

苏打饼干有哪些？苏打饼干的功效与作用是什么？