让视觉语言模型搞空间推理,谷歌又整新活了

是否能够赋予视觉语言模型类似于人类的空间推理能力?

via 机器之心
 
 
Back to Top