https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持OpenAI, Claude, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
SpeechGPT2:一个端到端的语音对话语言模型 能够感知和表达情感

SpeechGPT2 是由复旦大学计算机学院开发的一个端到端的语音对话语言模型,类似于 GPT-4o。它能够感知和表达情感,并根据上下文和人类指令提供多种风格的语音响应,如说唱、戏剧、机器人、搞笑和低语等。为了处理冗长的语音序列,SpeechGPT2 使用了一种超低比特率的语音编解码器 (750bps),能够建模语义和声学信息。

预训练数据包括超过10万小时的学术和野外收集的语音数据,这些数据涵盖了丰富的语音场景和风格。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.
Login if you have purchased

加入会员
加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
开通会员

via XiaoHu.AI学院 (author: 小互)
Stability AI 推出 Stable Video 4D 通过单个视频并生成八个新角度的动态新视角视频

Stability AI 宣布推出 Stable Video 4D(SV4D),这是一款创新模型,用户可以上传单个视频并生成八个新角度的动态新视角视频。

与以往需要从图像扩散模型、视频扩散模型和多视角扩散模型中取样的方法不同,SV4D 能够同时生成多个新视角视频,大大提高了空间和时间轴上的一致性。这不仅确保了多个视角和时间戳中对象外观的一致性,还实现了更轻量级的4D优化框架,无需使用多个扩散模型进行繁琐的得分蒸馏采样(SDS)。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.
Login if you have purchased

加入会员
加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
开通会员

via XiaoHu.AI学院 (author: 小互)
🤖 必应的 AI 强化搜索大改版:摘要占据中心舞台

必应正在通过优先考虑 AI 生成的摘要来颠覆其搜索体验,而不是传统的搜索结果。这种新的布局目前正在有限范围内推出,为用户提供全面的 AI 生成的答案,包括摘要、要点、相关视频、图表,甚至音乐细节。例如,搜索“什么是意大利面西部片?”会得到详细的解释、历史背景、热门电影等等。虽然微软声称这种方法可以维持网站流量,但一些用户担心可能会出现不准确的信息,以及传统搜索结果的可见度降低。谷歌类似的 AI 概述功能因提供不准确的答案而受到批评,突出了完全依赖 AI 获取信息的挑战。

(The Verge)

via 老裕泰 - Telegram Channel
📈 Alphabet 股价因利润率担忧和 YouTube 增速放缓而暴跌

Alphabet 的股价周三下跌超过 3%,原因是投资者担心不断增加的人工智能基础设施投资会压缩利润率,以及 YouTube 面临着来自广告收入的激烈竞争。尽管 Alphabet 的核心搜索业务增长超过预期,但其增长速度放缓,而 YouTube 广告销售额在第二季度仅增长了 13%,低于第一季度的 21%。该公司第二季度的资本支出飙升至 132 亿美元,这得益于人工智能投资。虽然 Alphabet 一直在削减成本,但分析师预测,增加招聘和提前发布 Pixel 手机将对第三季度利润率造成压力。尽管股价下跌,但许多分析师仍然看好 Alphabet,理由是其云收入强劲增长,以及人工智能概述对搜索收入的影响微乎其微。Alphabet 的 12 个月远期市盈率为 22.2,而英伟达的市盈率为 38.6。

(路透社)

via 老裕泰 - Telegram Channel
🤖 AI:生产力提升还是倦怠助推器?

一项新的调查揭示了一个令人担忧的趋势:尽管高管们期望 AI 能够提高生产力,但员工却难以跟上。这项由 Upwork 进行的研究调查了来自美国、英国、澳大利亚和加拿大的 2500 名员工。虽然 96% 的高管预计 AI 驱动的效率会提高,但 47% 使用 AI 工具的员工不确定如何实现这些收益。事实上,77% 的员工报告称,由于 AI,他们的生产力下降,工作量增加。调查强调了几个促成因素:39% 的员工花费额外时间验证 AI 输出,因为存在不准确性;21% 的员工难以学习新的 AI 工具;40% 的员工感到公司对 AI 的期望令他们不堪重负。这些压力导致了倦怠,71% 的全职员工经历了倦怠,65% 的员工难以应对雇主的要求。令人担忧的是,三分之一的员工正在考虑在未来六个月内辞职,原因是倦怠或工作过度。该研究表明,AI 与其他办公技术一样,除了带来益处之外,也会带来新的负担。作者建议对工作组织进行根本性转变,以充分发挥 AI 的潜力,同时确保员工的福祉。

(PCMag.com)

via 老裕泰 - Telegram Channel
🤖 Mistral 大模型 2:强大的多语言 AI 模型

Mistral AI 发布了 Mistral 大模型 2,这是一个拥有 1230 亿参数、128k 上下文窗口的语言模型。该模型在各种基准测试中表现出色,包括 MMLU(准确率 84.0%)、代码生成和推理任务。它在多语言能力方面表现出色,支持 80 多种语言和编程语言。

Mistral 大模型 2 专为单节点推理而设计,使其在长上下文应用中具有成本效益。它在 Mistral 研究许可下提供非商业用途,并提供商业许可用于自部署。

该模型可通过 la Plateforme 访问,并与领先的云服务提供商集成,例如 Google Cloud Platform、Azure AI Studio、Amazon Bedrock 和 IBM watsonx.ai。

(HackerNews)

via 老裕泰 - Telegram Channel
🚨 参议院通过法案打击深度伪造滥用 🚨

参议院一致通过了《破坏显式伪造图像和非自愿编辑法案》(DEFIANCE法案),该法案允许性侵深度伪造的受害者起诉其制造者以索取赔偿。该法案现已提交众议院审议,为受害者提供最高 150,000 美元的赔偿,如果深度伪造与性侵犯、跟踪或骚扰有关,则赔偿金额增加至 250,000 美元。该法案的通过是在非自愿深度伪造事件激增之后,包括针对泰勒·斯威夫特等名人以及高中生的事件。多数党领袖查克·舒默强调了该问题的普遍性,并呼吁制定更多人工智能立法以防止其被滥用。

(The Verge)

via 老裕泰 - Telegram Channel
OpenAI 今年可能亏损 50 亿美元 并可能在 12 个月内耗尽现金

OpenAI 建立了历史上增长最快的企业之一,也可能是运营成本最高的企业之一。根据基于此前未披露的内部财务数据和参与该业务的人员提供的信息进行分析,OpenAl 的 AI 训练和推理成本今年可能达到 70 亿美元,员工成本可能高达 15 亿美元,其今年可能运营亏损高达 50 亿美元。因此,最近估值为 800 亿美元的 OpenAI 将需要在未来 12 个月左右筹集更多资金,以避免现金流断裂。

—— The Information

via 风向旗参考快讯 - Telegram Channel
🤖卡佩尼克推出 AI 初创公司,赋能创作者

前 NFL 四分卫科林·卡佩尼克推出了 Lumi Story AI,这是一个由 AI 驱动的平台,旨在帮助创作者克服媒体和出版行业的障碍。Lumi 获得了 Seven Seven Six 的 400 万美元种子资金支持,旨在为有抱负的创作者提供工具,例如生成漫画插图或将艺术与文字配对。卡佩尼克一直直言不讳地谈论种族不公,他将 Lumi 看作是赋能创作者和民主化故事讲述的一种方式。该平台通过专注于增强创作者的能力来解决人们对 AI 取代工作的担忧。Lumi 推出了漫画的测试版,并计划将其产品扩展到包括商品创作。

(华尔街日报)

via 老裕泰 - Telegram Channel
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]