ChatGPT / AI新闻聚合
14:05 · 2024年4月8日 · 周一
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
via
机器之心
Telegraph
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
2024-04-07 13:02 北京 实现180万像素任意长宽比图像编码。 机器之心专栏机器之心编辑部 GPT-4V 的推出引爆了多模态大模型的研究。GPT-4V 在包括多模态问答、推理、交互在内的多个领域都展现了出色的能力,成为如今最领先的多模态大模型。 然而,近期很多工作发现 GPT-4V 在很多基本能力上却意外的出现短板。例如,在微软一篇长达 166 页的技术报告《The Dawn of LMMs:Preliminary Explorations with GPT-4V (ision)》中,作者…
Home
Tags
Powered by
BroadcastChannel
&
Sepia