https://api.oaibest.com - API中转2.8折起
https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
借知名政客推进布局 OpenAI聘请英国前财长与各国合建AI基础设施

据彭博社报道,OpenAI已聘请英国前财政大臣乔治·奥斯本(George Osborne)领导一项与各国政府合作建设AI基础设施的新计划。在各国竞相部署运行先进AI系统所需的数据中心和算力之际,OpenAI借助这位知名政治人物来推进相关布局。

奥斯本

OpenAI首席运营官布拉德·莱特卡普(Brad Lightcap)周二在社交媒体发文称,奥斯本将担任“OpenAI国家合作计划”(OpenAI for Countries)负责人。莱特卡普表示,各国政府需要帮助来理解AI如何融入其经济发展战略,以及医疗、教育等公共服务领域。

奥斯本目前兼任《政治资本》(Political Currency)播客联合主持人与大英博物馆董事会主席。他表示,在与OpenAI CEO萨姆·奥特曼(Sam Altman)、首席运营官莱特卡普及其他高管交流后,他决定加入该计划。他将这项计划描述为旨在帮助社会共享AI发展红利。

奥斯本将常驻伦敦工作,对于他的聘请是OpenAI今年早些时候宣布的一项计划的一部分,该计划旨在与各国政府就AI基础设施及产品本土化展开合作。据彭博社5月报道,“OpenAI国家合作计划”旨在帮助各国政府扩充数据中心容量,并根据当地语言和需求定制AI工具,资金将由OpenAI与参与国政府共同承担,初步目标是启动10个国际合作项目。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:凤凰网科技)
OpenAI与亚马逊谈判寻求至少100亿美元融资 并计划使用其AI芯片

据三位知情人士透露,亚马逊正在洽谈向OpenAI投资至少100亿美元。其中一位人士表示,该交易将使OpenAI的估值突破5000亿美元。亚马逊的投资将帮助OpenAI履行其向云服务提供商租赁服务器的承诺,其中包括亚马逊云科技。

OpenAI上月宣布,将在未来七年内投入380亿美元从AWS租赁服务器,这使得AWS成为OpenAI用于开发人工智能的至少五家云服务提供商之一。

该交易还可能帮助亚马逊为其Trainium AI服务器芯片找到新客户,这款芯片目前正与OpenAI主要使用的英伟达AI芯片竞争。两位知情人士称,作为谈判的一部分,OpenAI计划使用Trainium芯片。

不过,亚马逊将无法向其云客户销售OpenAI模型,因为拥有OpenAI约27%股份的微软已获得独家销售权。

一位知情人士透露,亚马逊与OpenAI已探讨过电商合作机会。OpenAI希望将ChatGPT打造成购物中心,并考虑通过为零售商引流赚取佣金。目前尚不清楚亚马逊与OpenAI的交易是否会涉及ChatGPT相关功能的合作安排,或亚马逊正在为自家应用程序开发的AI购物功能。

该人士还表示,OpenAI希望向亚马逊销售企业版ChatGPT。

两位知情人士称谈判仍在进行中,具体条款可能变动。其中一位人士指出,亚马逊的融资可能推动OpenAI启动包含更多投资者的广泛筹资计划。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
推特争论引发学术新发现!谢赛宁团队发布 iREPA,仅需 3 行代码!

最近,谢赛宁团队的新作 “iREPA” 便是源于一场持续了四个月的推特辩论。这场论战虽以谢赛宁的让步为结局,却意外催生了一篇重要论文,展示了新颖的研究思路。

事件的起源可以追溯到八月份。当时,一位网友在推特上提出了关于自监督学习(SSL)模型的看法,认为它们应该专注于稠密任务,因为这些任务依赖于图像的空间和局部信息,而不仅仅是全局分类性能。谢赛宁对此提出了反驳,认为全局性能与稠密任务并没有直接关系。

网友们展开了热烈的讨论,其中一位网友还分享了可以与 REPA 进行比较的方案。这个讨论激发了谢赛宁的兴趣,并促使他深入探索这一问题。几个月后,谢赛宁表示,自己之前的看法被修正,并且这篇论文的研究为理解视觉编码器的生成能力提供了新视角。

在这篇论文中,研究者们探讨了在预训练视觉编码器中,究竟是哪些部分决定了生成模型的表现。结果显示,空间结构的信息,而非全局语义,才是驱动生成质量的关键因素。传统观点认为更好的全局语义信息能提升生成效果,但研究表明,实际上较低准确率的视觉编码器往往能实现更好的生成性能。

为了解决这一问题,研究者们提出了 iREPA,这一新框架仅需三行代码即可整合到任何表示对齐方法中。通过对 PA 的改,如用卷层替换传统的 MLP 投影层,研究者们成功强化了空间结构信息,显著提升了生成性能。

这次学术讨论不仅展示了开放和的科研氛,更强调了通过交流和实验获取知识的重要性。

via AI新闻资讯 (author: AI Base)
字节跳动发布 Seedance 1.5 Pro:AI 音视频创作进入 100% 视听同步时代!

12月16日,字节跳动在北京正式发布了其新一代音视频创作模型 ——Seedance1.5pro。这一全新的创作工具不仅在音视频生成领域实现了重大突破,还为用户带来了更为丰富的视听体验。

Seedance1.5pro 支持音视频的联合生成,用户可以通过文本输入生成音视频内容,或者利用图像引导生成音视频。这一版本在 Seedance1.0的基础上进行了多项技术升级,提升了生成内容的视觉冲击力和运动效果,同时增强了音频同步生成的能力。通过精准的视听同步,Seedance1.5pro 能够实现更高水平的角色口型、语调与表演节奏的拟合,支持多语种和方言的自然表达。

在发布会上,字节跳动展示了 Seedance1.5pro 在多种应用场景中的潜力。该模型具备先进的镜头调度能力,可以执行高难度的镜头运动,如长镜头跟随和希区柯克变焦,增强了视频的动态张力。此外,Seedance1.5pro 通过语义理解技术,能够更好地解析叙事语境,从而提升音视频段落的整体叙事协调性。

这一新模型在影视艺术创作、短剧生成、广告制作以及戏曲演绎等多个领域展现了优异的表现力和视听融合度。发布会上,观众们观看了 Seedance1.5pro 生成的赛博朋克风格短片,该短片通过细腻的表情捕捉和流畅的叙事逻辑,展现了丰富的人类情感与动态场景的完美结合。

Seedance1.5pro 还特别强调了其多语种和方言的支持,这为创作者提供了更广泛的表达方式,尤其在喜剧等需要风格化表演的内容创作中,更能展现出鲜活的生动感。

据悉,Seedance1.5pro 已在即梦 AI 和豆包平台上线,用户可以通过这些平台进行体验和反馈。这一创新的音视频创作工具的推出,标志着音视频创作进入了一个新的时代,字节跳动期待未来更多创作者能够利用这一强大的模型,创作出更多优秀的作品。

随着技术的不断进步,Seedance1.5pro 的发布无疑为音视频创作带来了新的可能性,推动了行业的发展与创新。

via AI新闻资讯 (author: AI Base)
🤖 Google Labs 推出 AI 助手 CC,整合邮件日历生成每日简报

Google Labs 今日发布实验性 AI 生产力助手 CC。该工具基于 Gemini 模型,能连接 Gmail、Google 日历和 Google Drive,并从网络获取信息,每天早晨向用户邮箱发送“今日概览”简报,整合日程、任务和更新。CC 具备智能代理功能,可识别用户需求,自动起草邮件和创建日历链接。用户可通过回复邮件或发送邮件与其交互。目前,该服务仅面向美国和加拿大的 Google 个人账户开放早期访问,需加入候补名单,Google AI Ultra 和付费订阅用户享有优先权。

(科技圈)

via 茶馆 - Telegram Channel
Meta 推出新款 AI 眼镜,助你更清晰地听到对话

Meta 近日推出了一款新型 AI 眼镜,旨在帮助用户更清晰地听到周围人的对话。这款眼镜采用开放式扬声器设计,可以放大与用户交谈的人的声音,提升日常交流的便利性。这一功能特别适合在嘈杂环境中使用,例如咖啡馆或繁忙的街道,让用户更轻松地参与对话。

尽管这款眼镜的功能令人期待,但 Meta 同时宣布其 Messenger 桌面应用程序将于2025年12月15日停止服务。该应用最初是在新冠疫情期间推出的,然而在与 Zoom 等竞争对手的比较中,Messenger 未能提供足够的视频通话参与人数、屏幕共享和便捷链接分享等功能,导致其重要性逐渐下降。

Meta 在今年开始将 Messenger 逐步整合回 Facebook 主应用中,旨在提升用户的使用体验。过去,Messenger 的 Mac 版本是基于 Catalyst 开发的,这一技术允许开发者将 iPad 应用迁移至 Mac,但受到了开发者和用户的批评,因为这使得应用缺乏原生体验。在此之前,Messenger 的 Mac 版本曾使用 Electron 和 React Native 等技术开发。

随着 Meta 逐步取消 Messenger 桌面应用,用户被引导到 Facebook 网站继续使用此服务。Messenger 没有 Facebook 账户的用户则可以直接访问 Messenger.com 登录,而无需创建 Facebook 账户。此外,Meta 还建议用户设置 PIN 以保存聊天记录,确保过渡顺利。

这次更新显示了 Meta 在推动技术整合及提升用户体验方面的努力,同时也反映了社交网络领域的竞争日益激烈。

划重点:

📱 Meta 推出新款 AI 眼镜,增强用户听力体验。

🛑 Messenger 桌面应用将于2025年停止服务,用户需转至网页使用。

🔄 Meta 将 Messenger 整合回 Facebook,旨在提升整体用户体验。


via AI新闻资讯 (author: AI Base)
Google Labs 推出 AI 助手 CC,可整合邮件日历生成每日简报

Google Labs 今日发布实验性 AI 生产力助手 CC,该工具每天早晨向用户邮箱发送「今日概览」简报。CC 基于 Gemini 模型构建,可连接 Gmail、Google 日历和 Google Drive,并从网络获取信息,将用户的日程安排、关键任务和更新内容整合为清晰摘要。

CC 具备智能代理功能,能识别用户是否需要准备约会或缴费,并可自动起草邮件和创建日历链接。用户可通过回复每日邮件来训练 CC,或直接发送邮件至专用地址与其交互。该服务目前仅面向美国和加拿大的 Google 个人账户开放早期访问,需加入候补名单,Google AI Ultra 和付费订阅用户享有优先权。

9To5Google | 加入候补名单

🍀在花频道 🍵茶馆 📮投稿新鲜事

via 科技圈🎗在花频道📮 - Telegram Channel
音乐界怒斥 AI 克隆歌曲泛滥,行业亟需整治

近日,音乐人、制作人及行业人士对 AI 生成的克隆音乐表达了越来越强烈的反对声。虽然 AI 假曲早已存在,但随着技术的进步,假曲的数量和质量都在激增,让许多艺术家感到愤怒和无奈。早在2023年,就出现了多首 AI 伪造的 Drake 歌曲,然而在过去两年中,问题愈加严重。从碧昂丝到实验作曲家威廉・巴辛斯基,许多知名艺术家都遭遇了类似困扰,伪作音乐在流媒体平台上与他们的名字并列播放。

图源备注:图片由AI生成,图片授权服务商Midjourney

最近,澳大利亚乐队 King Gizzard & The Lizard Wizard 也成为了新的目标。乐队主唱 Stu Mackenzie 在接受采访时对此表达了愤怒和无助,甚至感叹 “我们真的是注定要毁灭”。在这种背景下,流媒体平台 Spotify 已采取措施,正式制定了针对冒名顶替的政策,并清除了7500万首垃圾歌曲。然而,现有系统的运作方式让治理问题变得复杂。根据 Deezer 的数据,每天都有5万首 AI 生成的音乐上传至其平台,占其音乐库的34% 以上。

不法分子利用了音乐并不是直接上传到 Spotify 等平台的漏洞,而是通过第三方分发服务(如 DistroKid)进行发布。因此,如何确保上传者的身份真实性仍然是一个悬而未决的问题。

划重点:

🎶 许多音乐人对 AI 生成的克隆音乐表示愤怒,认为其影响了艺术创作的真实性。

🔍 Spotify 和 Deezer 等流媒体平台面临大量 AI 音乐上传的挑战,监管措施亟需加强。

⚠️ 不法分子利用音乐分发服务的漏洞,导致假音乐泛滥,上传者身份审核成为关键问题。


via AI新闻资讯 (author: AI Base)
Adobe Firefly视频功能大升级:支持精准提示编辑、集成FLUX.2与Astra,告别“重做整段视频”时代

Adobe 正全力加码AI视频创作赛道。其AI生成平台 Firefly 近日迎来重大更新:正式推出全新视频编辑器,首次支持基于文本提示的精准局部修改,并集成 Black Forest Labs 的 FLUX.2图像模型、Topaz Labs 的 Astra 视频超分模型,以及 Runway 的 Aleph 模型,大幅拓展创作自由度与画质上限。

过去,Firefly 视频功能仅支持“端到端生成”——若对成片中任意细节不满(如天空太亮、镜头太远),用户只能重新输入完整提示词,从头生成整段视频,效率低下且难以控制。如今,借助新编辑器,用户可直接输入指令如“将天空改为阴天并降低对比度”或“轻微放大主体”,系统将仅修改指定元素,保留其余内容不变。

新功能还带来可视化时间轴界面,用户可逐帧调整画面、音频、转场等参数,实现精细剪辑。更强大的是,Adobe 自研的 Firefly Video 模型支持相机运动迁移:用户上传起始帧与一段参考视频(展示所需运镜),AI 即可复现相同镜头语言,为短视频创作者提供电影级运镜能力。

在第三方模型整合方面,Firefly 此次动作频频:

- FLUX.2(Black Forest Labs):业界领先的图像生成模型,即日起全平台可用,Adobe Express 用户从1月起也可调用;

- Astra(Topaz Labs):支持将低清视频智能升频至1080p或4K,显著提升输出质量;

- Runway Aleph:增强对复杂编辑指令的理解能力。

为吸引用户深度使用,Adobe 还推出限时福利:Firefly Pro、Premium 及高额度订阅用户,在1月15日前可享受所有图像模型与Firefly视频模型的无限生成次数。

自今年2月推出分级订阅制以来,Adobe 已快速迭代 Firefly 生态,相继上线网页端、移动端,并持续引入外部模型,构建开放生成平台。此次视频编辑能力的突破,标志着 Firefly 从“AI生成工具”正式迈向“AI视频创作工作站”——在 Runway、Pika、Sora 等对手环伺之下,Adobe 正以专业级工作流+生态整合,争夺创意工作者的首选入口。

via AI新闻资讯 (author: AI Base)
Cloudflare 报告称半数网络中断事故是政府干预导致的

2025-12-16 17:59 by 圣天秤星

Cloudflare 发布了年度报告《2025 Year in Review》。报告称全球互联网流量增长 19%;最流行的互联网服务仍然是 Gooogle、Facebook 和苹果;最流行的社交网络是 Facebook、Instagram、TikTok、Snapchat、LinkedIn,X / Twitter 排名第六;最流行的新闻服务是 Globo、ESPN、BBC、NY Times 和 CNN;SpaceX Starlink 卫星互联网流量增长 2.3 倍;52% 的 TLS 1.3 流量使用了后量子加密;AI 机器人流量最主要目的是训练;最流行的 Workers AI 模型是 @cf/meta/llama-3-8b-instruct;Workers AI 最流行的任务是文本生成;AI 机器人占了 HTTP 请求的 4.2%,Google 机器人占 4.5%,非 AI 机器人占 47.9%,人类占 43.5%;移动流量 iOS 占 35% Android 占 65%;21% 的流量使用 HTTP/3,HTTP/2 占 50%;主流网站有 37% 使用 Google Analytics;Go 是最流行的 API 客户端语言;Google 搜索引擎桌面份额占 79.5%,总份额占 89.5%,百度占总搜索份额的 1.4%;在桌面浏览器市场,Chrome 占 67.9%,Edge 14.4%,Firefox 6.7%,Safari 6.2%,Opera 2.2%;在包括移动和桌面的浏览器市场,Chrome 占 66.2%,Safari 15.4%,Edge 7.4%,Firefox 3.7%,Samsung Internet 2.3%;2025 年共发生了 174 起重大的互联网中断事故,83 起是政府导致的,中国共发生了一起:2025 年 8 月 20 日北京时间约 00:34 至 01:48 期间,HTTPS 访问短暂受限。

https://radar.cloudflare.com/year-in-review/2025#internet-outages
https://it.solidot.org/story?sid=82092

#互联网

via Solidot - Telegram Channel
普渡大学提出类脑 AI 算法:旨在打破“内存墙”,大幅降低能耗

随着大型人工智能模型对海量数据的依赖日益加深,传统计算机架构中内存与处理能力分离所导致的**“内存墙”**瓶颈正消耗巨大的时间和能源。普渡大学和佐治亚理工学院的研究人员在《科学前沿》杂志上发表了一项新研究,提出了一种利用类脑算法构建新型计算机架构的方法,以期大幅降低人工智能模型的能耗。

 冯·诺依曼架构的瓶颈:内存墙

当前大多数计算机仍基于1945年提出的冯·诺依曼架构,该架构将内存和处理能力分置,导致数据在两者之间快速流动时形成性能瓶颈。普渡大学计算机工程教授、研究主要作者考希克·罗伊指出,过去四年里,语言处理模型的规模增长了 5000倍,使得这种效率问题变得至关重要,并呼吁从根本上重新思考计算机的设计方式。计算机工程师将内存容量难以跟上处理速度的这一问题称为**“内存墙”**,它消耗了运行底层人工智能模型所需的大量时间和能源。

解决方案:受人脑启发的“内存计算”

该论文的研究人员认为,解决内存瓶颈的关键在于尝试一种将内存和处理能力整合在一起的新型计算机架构,这种方法被称为**“内存计算”(Compute-in-Memory, CIM)**。

● 算法核心:研究人员建议,AI 模型应采用受人脑运作方式启发的脉冲神经网络(Spiking Neural Networks, SNN)。虽然 SNN 过去因速度慢、精度低而受诟病,但近年来其性能已显著提升。
● CIM 优势:论文摘要指出,“CIM 通过将计算能力直接集成到内存系统中,为解决内存墙问题提供了一个很有前景的解决方案。”通过这种整合,可以减少数据传输量并提高处理效率。

 应用前景:从数据中心走向现实世界

研究人员相信,将计算机处理和内存集成到一个系统中,将能大幅降低人工智能的能耗。普渡大学合著者兼研究员坦维·夏尔马表示:“要将(人工智能)从数据中心转移到现实世界,我们需要大幅降低其能源消耗。”

通过这种方法,人工智能可以集成到体积小、价格实惠且电池续航时间更长的设备中,从而改进医疗设备、交通运输和无人机等多个领域。

via AI新闻资讯 (author: AI Base)
阿布扎比 G42推出87亿参数的开源印英语言模型 NANDA87B

阿布扎比的人工智能集团 G42于周二正式发布了 NANDA87B,这是一款拥有87亿参数的开源印英大型语言模型,标志着其早期版本 NANDA 的升级。NANDA87B 现已在 MBZUAI 的 Hugging Face 页面上以开放权重的形式提供,开发者、创作者和企业可以自由使用并扩展其功能。

这款模型由穆罕默德・本・扎耶德人工智能大学(MBZUAI)与 G42旗下的 Inception 公司及芯片制造商 Cerebras 合作开发。NANDA87B 是基于 Llama-3.170B 模型构建的,并在超过650亿个印地语标记上进行训练,采用印地语专用的分词器,以提高训练和推理的效率。

G42印度首席执行官马努・贾因表示:“印度应当拥有能够说其语言的世界级技术。NANDA87B 是朝着这一目标迈出的重要一步。” 他补充说,该模型旨在支持印度 AI 生态系统中的教育、娱乐和企业等多个领域的创新。

G42表示,NANDA87B 设计能够处理正式印地语、日常口语和混合印地语(Hinglish),并能够执行翻译、摘要、指令跟随和音译等多项任务。该公司还强调,模型的设计过程中考虑了安全性和文化一致性,以确保输出结果的责任性。

穆罕默德・本・扎耶德人工智能大学基础模型研究所执行董事理查德・莫顿表示,此次发布标志着扩展高级语言技术可及性的重大进展。“NANDA 标志着为全球最大语言社区之一提供高质量、开放访问语言技术的重要里程碑,” 他说。

NANDA87B 的训练是在 G42和 Cerebras 联合打造的 Condor Galaxy 超级计算系统上进行的。

划重点:

🌟 NANDA87B 是 G42推出的87亿参数开源印英语言模型,旨在促进印度的技术发展。

💻 模型支持正式印地语、日常口语和混合印地语,可执行多种语言处理任务。

🔍 此次发布标志着对高级语言技术可及性的扩展,推动全球最大语言社区的技术进步。


via AI新闻资讯 (author: AI Base)
DoorDash推AI社交新应用Zesty:用聊天找餐厅,把美食发现变成社交体验

外卖巨头DoorDash正悄然跳出“送餐”边界,杀入本地生活发现与社交赛道。公司近日在旧金山湾区和纽约试点推出全新AI驱动社交应用 Zesty,旨在让用户“不用翻遍点评、菜单或TikTok”,仅通过自然语言对话,就能快速找到心仪餐厅。

Zesty的核心是一套深度个性化的AI推荐引擎。用户登录后(支持DoorDash账号一键接入),可直接向内置聊天机器人提问,例如:“威廉斯堡一家真正适合内向者的低调晚餐场所”或“有复古氛围的浪漫餐厅”。系统不仅理解语境与情绪,还能根据用户过往偏好持续学习,动态优化推荐结果。应用还提供智能提示,如“适合聚会的早午餐地点”“宠物友好的咖啡馆”等,降低使用门槛。

与传统点评平台不同,Zesty融合了社交网络逻辑:用户可保存、分享餐厅推荐,上传实拍照片与点评,关注他人动态,甚至形成“美食兴趣圈层”。DoorDash联合创始人Andy Fang在X平台上透露,Zesty的数据源横跨DoorDash自身交易数据、Google Maps、TikTok内容等多平台信息,通过AI聚合与提炼,“从全网精选最值得去的地方”。

这一举措标志着DoorDash“超越外卖”的战略加速落地。今年早些时候,公司已推出堂食预订与到店积分功能,如今Zesty进一步将其从“履约平台”转型为“本地生活入口”。一位DoorDash发言人向TechCrunch确认:“我们希望帮助人们更轻松地连接社区中的美好体验,而Zesty正是探索下一代本地发现的实验场。”

当然,挑战亦不容忽视——在Google、ChatGPT、Gemini等通用AI已能提供餐厅推荐的当下,用户是否愿意为单一场景下载新应用?但对重度美食爱好者或社交驱动型用户而言,Zesty提供了一种新可能:把“吃什么”从决策负担,变成可分享、可互动、有归属感的生活方式。

Zesty或许不是下一个Instagram,但它正在尝试回答一个关键问题:当AI能读懂你的口味,美食发现是否也能拥有“社区感”?DoorDash的答案,就藏在那条“适合内向者的晚餐”推荐里。

via AI新闻资讯 (author: AI Base)
💰 OpenAI洽谈向亚马逊融资至少100亿美元并使用其AI芯片

据The Information报道,人工智能公司OpenAI正与亚马逊进行深入谈判,旨在从亚马逊筹集至少100亿美元的资金,并计划在其运营中采用亚马逊的AI芯片。

(财经快讯)

via 茶馆 - Telegram Channel
日本科学家发布“Sui”编程语言,宣称能让 LLM100% 准确编写代码

日本数据科学家 Takato Honda (本田崇人) 近日推出了一门全新的开源编程语言 “Sui”(粋),旨在革命性地解决大型语言模型(LLM)编写代码的准确性问题,并宣称能让 LLM 以100% 的准确率生成代码。

据悉,该语言的名称源于日本美学中的 “粋”,意为**“精炼”和“去除冗余”,其设计理念是只保留必需品。Sui 的核心设计原则包括:结构上保证零语法错误率**;通过使用数字作为变量而非名称,实现零拼写错误;保证行级独立性,即每一行代码都是完全独立的;它被设计为一门纯逻辑语言,仅用于计算,用户界面可以自由搭配任何现有框架(如 React、Vue 等)来实现。

本田崇人认为,一旦 LLM 学习了 Sui,该语言针对 Token 效率进行优化的特性将使其效率超越现有语言,为 AI 辅助编程领域带来突破。

地址:https://github.com/TakatoHonda/sui-lang

via AI新闻资讯 (author: AI Base)
艾伦人工智能研究所推出 Molmo 2 开源视频语言模型

近日,艾伦人工智能研究所(Ai2)发布了全新的 Molmo2开源视频语言模型。这一系列新模型和相关训练数据展示了该非营利机构在开源领域的坚定承诺,特别是在企业希望掌控模型使用的背景下,这无疑是一项重大利好。

Molmo2包含几种不同的模型版本,包括基于阿里巴巴 Qwen3语言模型的 Molmo2-4B 和 Molmo2-8B,此外还有基于 Ai2Olmo 语言模型的完全开源版本 Molmo2-O-7B。除了模型,Ai2还推出了九个新的数据集,这些数据集包括多图像和视频输入的长格式质量保证数据集,以及一个开放的视频指向和跟踪数据集。

Molmo2的一个显著特点是其增强的功能。根据 Ai2的介绍,Molmo2-O-7B 是一个透明模型,允许用户进行端到端的研究和定制。这意味着用户可以全面访问视觉语言模型及其语言学习模型(LLM),从而能够更灵活地调整模型以满足特定需求。

Molmo2模型支持用户提问关于图像或视频的问题,并能够基于视频中识别的模式进行推理。Ai2的感知推理和交互研究主管 Ranjay Krishna 表示,这些模型不仅能给出答案,还能够在时间和空间上明确指出某些事件发生的时刻。此外,Molmo2还具备生成描述性字幕、追踪物体数量以及检测长视频序列中的罕见事件等能力。

用户可以在 Hugging Face 和 Ai2Playground 上使用 Molmo2,后者是 Ai2提供的平台,用户可以体验各种工具和模型。该发布彰显了 Ai2对开源的坚持,分析师 Bradley Shimmin 指出,发布与模型相关的数据和权重对于企业至关重要,尤其是在重视数据主权的背景下。

Molmo 系列的模型参数相对较小(40亿或80亿个参数),这对于很多企业来说更加经济实惠。Shimmin 强调,企业逐渐意识到,模型的大小并不是唯一的关键,训练数据的透明度和负责性同样重要。

项目:https://allenai.org/blog/molmo2

划重点:

1. 🚀 Ai2发布 Molmo2系列开源视频语言模型,增强了企业对模型使用的掌控。

2. 🎥 新模型支持多图像和视频输入,能够进行事件推理和生成描述性字幕。

3. 📊 Ai2坚持开源承诺,强调数据透明度和模型定制化的重要性。


via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]