ChatGPT / AI新闻聚合
10:37 · 2024年8月30日 · 周五
阿里云发布Qwen2-VL 最新视觉语言模型 能够理解长达20分钟以上的视频内容
via
XiaoHu.AI学院
(author: 小互)
Telegraph
阿里云发布Qwen2-VL 最新视觉语言模型 能够理解长达20分钟以上的视频内容
阿里云发布Qwen2-VL 最新视觉语言模型版本,较其前代Qwen-VL有显著提升。 Qwen2-VL具备多分辨率和比例图像的先进理解能力,并在多个视觉理解基准上表现出色,包括MathVista、DocVQA、RealWorldQA和MTVQA等。 此外,Qwen2-VL能够理解长达20分钟以上的视频内容,支持复杂推理和决策,使其能够与移动设备、机器人等进行自动化操作。 该模型还增加了多语言支持,能理解包括大部分欧洲语言、日语、韩语、阿拉伯语等在内的图像文本。 模型规模: 此次发布的模型包括开源的Qwen2…
Home
Tags
免费GPT聊天
Best AI API中转2.8折起
Best AI 服务状态
电报频道
Powered by
BroadcastChannel
&
Sepia
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]