https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
4月3日,千问APP正式上线全新万相2.7视频生成模型,凭借其更全面的创作控制能力,千问APP推出了视频编辑、视频续写与动作模仿三大核心功能,几句话即可让视频实现猫狗或人物替换。
在视频编辑上,用户只用几句话即可完成画面修改:给画面里加一个人、换一套衣服、调整背景环境,整体光影和细节也能自然匹配。此外,视频风格也支持一键切换,动画、3D、黏土等多种创意风格均可快速实现。
用户也可直接针对剧情内容修改,如直接调整角色的动作、表情,甚至修改台词内容,同时保持口型和语气的自然一致。同一段视频,还可以切换不同拍摄方式,比如换个机位、拉近镜头,让画面呈现出完全不同的感觉。
千问App支持视频续写,可将2秒视频最长续写至15秒。用户只需上传一小段已有视频,即可一键生成后续内容。千问App还提供了更精细的创作控制方式,用户可以结合首尾帧进行调整,在延续内容的同时,保证整体结构稳定、画面过渡更加自然,让生成效果连贯可控。
在动作模仿方面,用户可以基于参考视频,让画面中的人物复刻相同动作,包括多人协同或较复杂的动作变化。同时,视频中的运镜方式和特效节奏,也可以被一并复现,让创意表达更容易被迁移和再创作。
据悉,此前发布的图像生成与编辑统一模型Wan2.7-image也已在千问 APP上线。至此,Wan2.7图像模型与视频模型已全面上线千问 App,所有用户均可免费体验。
via AI新闻资讯 (author: AI Base)
美团发布原生多模态 LongCat-Next:视觉语音实现底层统一
4 月 3 日,美团技术团队正式发布原生多模态大模型 LongCat-Next。该模型突破了传统“语言基座+插件”的拼凑架构,通过将图像、语音与文本统一转化为同源的离散 Token,让 AI 第一次能够像处理文字一样,原生地“看”与“听”物理世界。
技术核心:DiNA 架构实现“模态内化”
为了打破模态间的隔阂,美团构建了 DiNA(离散原生自回归)架构,实现了多模态建模的深度统一:
● 全模态统一: 无论是文字、图像还是音频,模型都采用同一套参数、注意力机制和损失函数。
● 理解与生成对称: 在统一的数学形式下,预测文字 Token 即为“理解”,预测图像 Token 即为“生成”,两者在训练中表现出显著的协同潜力。
● 极致压缩: 采用 dNaViT 视觉分词器,支持任意分辨率输入,通过 8 层残差向量量化实现高达 28 倍的像素空间压缩,完整保留 OCR、财报解析等任务中的关键细节。
实证性能:离散建模没有“天花板”
LongCat-Next在多个维度上展现了超越专用模型的性能,有力回击了“离散化必然损失信息”的传统观点:
● 细粒度感知: 在 OmniDocBench 密集文本场景测试中,性能不仅超越 Qwen3-Omni,更优于专用视觉模型 Qwen3-VL。
● 视觉推理: 在 MathVista 测试中达到 83.1 的领先水平,展现出强大的工业级逻辑能力。
● 跨模态协同: 在保持领先语言能力(C-Eval 86.80)的同时,支持低延迟的并行文本语音生成及可定制的语音克隆。
行业观察:通往物理世界 AI 的基石
长期以来,大模型一直是以语言为中心的系统。而 LongCat-Next 的意义在于,它证明了物理信息可以被离散化并像语言一样被建模。当 AI 拥有了统一的“母语”,它在调用工具、编写代码以及理解复杂图表时会变得更加聪明和直观。
目前,美团已将LongCat-Next 模型及dNaViT 分词器全部开源。这一小尺寸、高潜力的原生离散架构,将为开发者构建能感知并作用于真实世界的 AI 提供重要工具。
via AI新闻资讯 (author: AI Base)
4 月 3 日,美团技术团队正式发布原生多模态大模型 LongCat-Next。该模型突破了传统“语言基座+插件”的拼凑架构,通过将图像、语音与文本统一转化为同源的离散 Token,让 AI 第一次能够像处理文字一样,原生地“看”与“听”物理世界。
技术核心:DiNA 架构实现“模态内化”
为了打破模态间的隔阂,美团构建了 DiNA(离散原生自回归)架构,实现了多模态建模的深度统一:
● 全模态统一: 无论是文字、图像还是音频,模型都采用同一套参数、注意力机制和损失函数。
● 理解与生成对称: 在统一的数学形式下,预测文字 Token 即为“理解”,预测图像 Token 即为“生成”,两者在训练中表现出显著的协同潜力。
● 极致压缩: 采用 dNaViT 视觉分词器,支持任意分辨率输入,通过 8 层残差向量量化实现高达 28 倍的像素空间压缩,完整保留 OCR、财报解析等任务中的关键细节。
实证性能:离散建模没有“天花板”
LongCat-Next在多个维度上展现了超越专用模型的性能,有力回击了“离散化必然损失信息”的传统观点:
● 细粒度感知: 在 OmniDocBench 密集文本场景测试中,性能不仅超越 Qwen3-Omni,更优于专用视觉模型 Qwen3-VL。
● 视觉推理: 在 MathVista 测试中达到 83.1 的领先水平,展现出强大的工业级逻辑能力。
● 跨模态协同: 在保持领先语言能力(C-Eval 86.80)的同时,支持低延迟的并行文本语音生成及可定制的语音克隆。
行业观察:通往物理世界 AI 的基石
长期以来,大模型一直是以语言为中心的系统。而 LongCat-Next 的意义在于,它证明了物理信息可以被离散化并像语言一样被建模。当 AI 拥有了统一的“母语”,它在调用工具、编写代码以及理解复杂图表时会变得更加聪明和直观。
目前,美团已将LongCat-Next 模型及dNaViT 分词器全部开源。这一小尺寸、高潜力的原生离散架构,将为开发者构建能感知并作用于真实世界的 AI 提供重要工具。
via AI新闻资讯 (author: AI Base)
亚马逊、英伟达集体入局!印度 AI 新星 Sarvam 开启 3.5 亿美元巨额融资
4月3日消息,印度人工智能初创公司Sarvam AI已正式开启新一轮融资,计划筹集 3亿至3.5亿美元。据悉,本轮融资后其估值将达到 15亿至15.5亿美元,最快有望在未来一周内尘埃落定。
豪华天团:全球科技巨头竞相押注
本轮融资的参投名单堪称“全明星”阵容,显示出全球资本对印度 AI 潜力的高度认可:
领投方: 预计由知名风投机构 贝塞默风险投资(Bessemer Venture Partners)担纲。
重量级巨头: 科技巨头亚马逊与 AI 芯片霸主英伟达均有意参与。
中东资本: 沙特阿美旗下的风险投资机构 Prosperity7Ventures 也在潜在大股东名单之列。
核心战力:深耕本土语料,打造“语音核心”AI
成立于2023年的Sarvam AI,凭借精准的差异化竞争在巨头林立的 AI 领域杀出重围:
本土化建模: 今年2月,该公司已发布两款参数分别为 300亿 和 1050亿 的大语言模型,且完全基于印度本土语料训练。
多语言覆盖: 重点开发支持 22种印度语言、以语音交互为核心的 AI 系统,直击印度碎片化语言市场的痛点。
Agentic 进化: 正在研发具备自主智能体(Agentic)能力的 AI 系统,旨在深度赋能企业自动化场景。
行业观察:南亚“AI 独角兽”的崛起
Sarvam AI的快速崛起,映射出 AI 浪潮下的新格局:在通用大模型之外,深植于特定语言文化和垂直应用场景的“本土冠军”正成为资本的新宠。对于英伟达和亚马逊而言,入股 Sarvam 不仅是一次财务投资,更是抢占南亚 AI 生态基座的关键布局。
结语:印度 AI 步入“大航海时代”
随着数亿美元资金的注入,Sarvam AI或将改写南亚乃至全球多语言 AI 的竞争版图。在这场算力与本土数据的融合赛中,印度力量正加速从“追赶者”变为“局中人”
via AI新闻资讯 (author: AI Base)
4月3日消息,印度人工智能初创公司Sarvam AI已正式开启新一轮融资,计划筹集 3亿至3.5亿美元。据悉,本轮融资后其估值将达到 15亿至15.5亿美元,最快有望在未来一周内尘埃落定。
豪华天团:全球科技巨头竞相押注
本轮融资的参投名单堪称“全明星”阵容,显示出全球资本对印度 AI 潜力的高度认可:
领投方: 预计由知名风投机构 贝塞默风险投资(Bessemer Venture Partners)担纲。
重量级巨头: 科技巨头亚马逊与 AI 芯片霸主英伟达均有意参与。
中东资本: 沙特阿美旗下的风险投资机构 Prosperity7Ventures 也在潜在大股东名单之列。
核心战力:深耕本土语料,打造“语音核心”AI
成立于2023年的Sarvam AI,凭借精准的差异化竞争在巨头林立的 AI 领域杀出重围:
本土化建模: 今年2月,该公司已发布两款参数分别为 300亿 和 1050亿 的大语言模型,且完全基于印度本土语料训练。
多语言覆盖: 重点开发支持 22种印度语言、以语音交互为核心的 AI 系统,直击印度碎片化语言市场的痛点。
Agentic 进化: 正在研发具备自主智能体(Agentic)能力的 AI 系统,旨在深度赋能企业自动化场景。
行业观察:南亚“AI 独角兽”的崛起
Sarvam AI的快速崛起,映射出 AI 浪潮下的新格局:在通用大模型之外,深植于特定语言文化和垂直应用场景的“本土冠军”正成为资本的新宠。对于英伟达和亚马逊而言,入股 Sarvam 不仅是一次财务投资,更是抢占南亚 AI 生态基座的关键布局。
结语:印度 AI 步入“大航海时代”
随着数亿美元资金的注入,Sarvam AI或将改写南亚乃至全球多语言 AI 的竞争版图。在这场算力与本土数据的融合赛中,印度力量正加速从“追赶者”变为“局中人”
via AI新闻资讯 (author: AI Base)
儿童安全联盟背后暗藏玄机:OpenAI 悄然出资引发质疑
在三月中旬,来自全国各地的儿童安全组织接到了一个名为 “父母与儿童安全 AI 联盟” 的组织的电子邮件,询问他们是否愿意支持该组织的政策优先事项。邮件中提到的 AI 监管原则包括年龄验证、家长控制以及禁止针对儿童的广告等相对不具争议的建议。然而,许多组织并不知情的是,这个联盟完全由全球知名的 AI 聊天公司 OpenAI 资助。
OpenAI 正在推动加州的立法进程,并与越来越多的支持者建立了联盟。然而,部分原本加入联盟的组织领导者表示,他们对 OpenAI 的参与程度并不知情,甚至在联盟正式公布后才得知相关信息,并因此选择退出。某些非营利组织的领导者对此感到十分不安,认为 OpenAI 在与他们沟通时使用了误导性的表述。
在回应媒体询问时,联盟的发言人表示,OpenAI 与其他六个成员正在努力争取美国最强的儿童 AI 安全法律。尽管如此,其他儿童安全组织则对 OpenAI 的参与表示了顾虑,呼吁其应让更有经验的儿童权益倡导者主导相关立法,而不是让 OpenAI 来制定规则。
OpenAI 正面临着对其产品儿童使用安全的重大考验。多个州正在提出立法以加强对儿童使用 AI 的监管。此外,OpenAI 还曾反对其他儿童安全立法,力图阻止更为严格的政策。
在一系列政治和公众关系活动中,OpenAI 通过邮件向儿童安全组织寻求支持,并未明确提及其作为主要资助者的身份,这种做法引发了外界的质疑。部分组织在得知真相后选择退出,并对 OpenAI 的透明度提出了疑虑。
在三月 17 日的联盟宣布中,OpenAI 的名字同样未被提及。专家指出,这种隐秘的资金支持和沟通方式符合 “草根运动” 的经典定义,容易让公众误解其真正意图。
via AI新闻资讯 (author: AI Base)
在三月中旬,来自全国各地的儿童安全组织接到了一个名为 “父母与儿童安全 AI 联盟” 的组织的电子邮件,询问他们是否愿意支持该组织的政策优先事项。邮件中提到的 AI 监管原则包括年龄验证、家长控制以及禁止针对儿童的广告等相对不具争议的建议。然而,许多组织并不知情的是,这个联盟完全由全球知名的 AI 聊天公司 OpenAI 资助。
OpenAI 正在推动加州的立法进程,并与越来越多的支持者建立了联盟。然而,部分原本加入联盟的组织领导者表示,他们对 OpenAI 的参与程度并不知情,甚至在联盟正式公布后才得知相关信息,并因此选择退出。某些非营利组织的领导者对此感到十分不安,认为 OpenAI 在与他们沟通时使用了误导性的表述。
在回应媒体询问时,联盟的发言人表示,OpenAI 与其他六个成员正在努力争取美国最强的儿童 AI 安全法律。尽管如此,其他儿童安全组织则对 OpenAI 的参与表示了顾虑,呼吁其应让更有经验的儿童权益倡导者主导相关立法,而不是让 OpenAI 来制定规则。
OpenAI 正面临着对其产品儿童使用安全的重大考验。多个州正在提出立法以加强对儿童使用 AI 的监管。此外,OpenAI 还曾反对其他儿童安全立法,力图阻止更为严格的政策。
在一系列政治和公众关系活动中,OpenAI 通过邮件向儿童安全组织寻求支持,并未明确提及其作为主要资助者的身份,这种做法引发了外界的质疑。部分组织在得知真相后选择退出,并对 OpenAI 的透明度提出了疑虑。
在三月 17 日的联盟宣布中,OpenAI 的名字同样未被提及。专家指出,这种隐秘的资金支持和沟通方式符合 “草根运动” 的经典定义,容易让公众误解其真正意图。
划重点:
📌 OpenAI 悄然资助 “父母与儿童安全 AI 联盟”,引发组织内外对透明度的质疑。
📌 多名儿童安全组织领导者在加入后才得知 OpenAI 的参与,并选择退出。
📌 专家指出此类行为可能被视为 “草根运动” 的伪装,造成公众误解。
via AI新闻资讯 (author: AI Base)
北京市互联网信息办公室正式发布了关于生成式人工智能服务的登记公告。根据《生成式人工智能服务管理暂行办法》及相关规定,使用 API 接口或其他方式直接调用已备案大模型的生成式人工智能应用或功能,将采用登记管理方式,这意味着这些应用或功能可以合法上线并提供服务。
截至2026年4月3日,北京市已新增15款完成登记的生成式人工智能服务。这些服务的上线为市民提供了更多便利和选择,促进了智能科技的应用和发展。
根据规定,所有已上线的生成式人工智能应用和功能,需在显著位置或产品详情页面公示其上线编号。此外,相关产品还需遵循《人工智能生成合成内容标识办法》,为生成的合成内容添加标识,确保透明度和用户知情权。
此次公告不仅是对生成式人工智能服务的规范管理,更是推动技术应用与监管并行的重要一步。市民们可以期待更多符合规范的优质服务,同时也要保持对人工智能生成内容的警惕和理性看待。
via AI新闻资讯 (author: AI Base)
DeepSeek 网页/APP 服务异常(DeepSeek Web/APP Service Abnormal)
Apr 3, 16:39 CST
Monitoring - A fix has been implemented and we are monitoring the results.
Apr 3, 16:38 CST
Update - We are continuing to investigate this issue.
Apr 3, 16:36 CST
Investigating - We are currently investigating this issue.
via DeepSeek Service Status - Incident History
Apr 3, 16:39 CST
Monitoring - A fix has been implemented and we are monitoring the results.
Apr 3, 16:38 CST
Update - We are continuing to investigate this issue.
Apr 3, 16:36 CST
Investigating - We are currently investigating this issue.
via DeepSeek Service Status - Incident History
Cursor 团队正式发布了 Cursor3版本,这标志着软件开发进入了一个全新的阶段,软件开发方式由过去的 “人机协作” 转向 “智能体自主工作”。新版本围绕智能体构建了一个统一的工作区,旨在提升开发者的编程体验,并实现多代码仓库的协同工作。
Cursor3的核心创新在于其 “智能体统一工作区” 设计。这个设计允许用户与多个智能体同时协作,不论是本地环境还是云端,所有智能体都能在侧边栏中集中展示。用户可以从不同的终端,如移动设备、Web、桌面和 Slack 等地方,方便地启动智能体。此外,云端智能体还能够生成工作成果的演示和截图,帮助用户更直观地确认项目进展。
另一大亮点是本地与云端智能体的无缝切换。开发者可以根据需要,将智能体会话在本地和云端之间快速切换。这种灵活性使得长时间运行的任务也能顺利进行,即使在离线状态下,开发者依然可以完成必要的工作。
在代码审查与团队协作方面,Cursor3引入了更加简洁的差异视图用户界面,使得代码变更的编辑和审查变得更加快速便捷。同时,新版本依然保留了 Cursor IDE 的核心优势,包括完整的语言服务器协议(LSP)支持、内置浏览器功能以及众多插件的支持。
Cursor 团队表示,Cursor3为构建更自主的智能体和提升团队协作能力奠定了基础。他们将继续投入 IDE 的开发,以实现代码库的自我驱动。未来,Cursor 将推动更强大的编程模型,以开启新的交互模式,助力开发者更高效地使用 AI 进行编程。
用户现可通过升级 Cursor,输入 Cmd+Shift+P -> Agents Window 来体验新界面。
划重点:
🧑💻 Cursor3版本发布,标志着软件开发进入智能体自主工作的新阶段。
☁️ 新版本支持多代码仓库协同与本地云端智能体的无缝切换。
🔍 引入简洁的差异视图 UI,提升代码审查与团队协作效率。
via AI新闻资讯 (author: AI Base)