https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持Deepseek、OpenAI(o3/GPTs/Sora/实时语音)、Claude、Gemini、Midjourney、文件上传
Buy ads: https://telega.io/c/AI_News_CN
🚨 苹果AI新闻摘要功能因错误报道遭批评

无国界记者组织(RSF)要求苹果公司移除其于12月11日在英国推出的AI驱动新闻摘要功能“Apple Intelligence”,原因是该功能存在不准确性。该系统错误地报道了据称为UnitedHealth枪手的Luigi Mangione去世(实际上他仍然健在)以及以色列总理本雅明·内塔尼亚胡被捕。这些由BBC投诉指出的错误引发了对虚假信息传播的担忧。RSF批评欧盟《人工智能法案》未将生成信息的AI归类为“高风险”,导致法律空白。苹果CEO蒂姆·库克承认,该AI容易出现“幻觉”——即捏造的信息问题。类似的问题也困扰着其他AI系统,包括谷歌的Gemini和X公司的Grok。

(PCMag.com)

via 茶馆 - Telegram Channel
OpenAI 发布推理模型 o3 和 o3-mini

周五,在“OpenAI 12天活动”的第12天,首席执行官萨姆·奥尔特曼宣布了其最新的人工智能“推理”模型o3和o3-mini,这两款模型是在今年早些时候推出的o1模型的基础上开发的。该公司尚未发布这些模型,但今天将使这些模型可用于公共安全测试和研究。就像o1一样,o3是一个模型家族,o3-mini是一款更小的精简版模型,专门针对特定任务进行了微调。OpenAI声称,至少在某些条件下,o3可以接近实现AGI。OpenAI总裁Greg Brockman表示,最新的推理模型o3是一个突破,在最困难的基准上有了阶跃函数的改进。现在开始安全测试和红队演练。

—— 财联社新浪财经OpenAI

via 风向旗参考快讯 - Telegram Channel
💰 数据砖公司融资100亿美元,AI人才争夺战白热化

数据分析公司Databricks获得创纪录的100亿美元融资,主要用于员工股票变现,凸显了人工智能人才争夺战的激烈程度。全球能够创建前沿模型的顶尖研究人员估计不足1000人,他们以及基础设施专家成为各大科技公司争抢的对象。OpenAI、Anthropic、亚马逊、谷歌、Meta、xAI和微软等公司都在积极争夺这些稀缺人才。虽然基础设施支持方面的人才库正在扩大,但顶级研究人员仍然炙手可热,导致AI公司估值大幅上涨。文章还指出,大型语言模型(LLM)的改进速度可能正在放缓,焦点正转向更好地利用现有模型进行商业应用。其他新闻包括谷歌削减管理层10%,Meta取消免费电动汽车充电,以及多家科技公司高管变动(例如Alec Radford离开OpenAI,Grammarly与Coda合并)。今年全球移动应用支出增长15.7%,下载量下降2.3%。

(The Verge)

via 茶馆 - Telegram Channel
📈 OpenAI o3模型在AI适应性方面取得突破性进展

OpenAI最新研发的o3系统在ARC-AGI-Pub半私有评估集上取得了75.7%的惊人成绩,显著超过了之前的基准。使用172倍的计算资源后,o3的得分更是达到了87.5%。这标志着人工智能在适应新任务能力方面取得了实质性飞跃,超越了之前的GPT模型。虽然在低计算模式下每次任务的成本高达17-20美元,但这项突破表明,在该领域实现人类水平的性能在经济上很快就会可行。旨在实现85%开源解决方案的ARC奖项将于2025年第一季度启动ARC-AGI-2,这是一个更具挑战性的基准,旨在进一步推动人工智能的能力。o3的成功突显了新型架构相较于简单地扩展现有模型的重要性。

(HackerNews)

via 茶馆 - Telegram Channel
今天,我们分享了关于我们o模型推理系列中下一个模型早期版本的评估:OpenAI o3。

(@OpenAI)

via 茶馆 - Telegram Channel
🚀OpenAI发布强大推理模型o3,性能大幅提升

OpenAI发布了新型人工智能推理模型o3和o3-mini,其性能显著优于前代模型。在SWE-Bench Verified编码测试中,o3的性能提升了22.8%,甚至在编程竞赛中超越了OpenAI的首席科学家。在2024年AIME数学竞赛中,o3几乎取得了满分(仅错一题),并在专家级科学基准测试GPQA Diamond中取得了87.7%的成绩。更令人瞩目的是,o3解决了25.2%的最难数学和推理问题,远超其他模型(低于2%)的水平。虽然o3目前尚未公开发布,但OpenAI正在接受研究申请,以获取早期访问权限。OpenAI还强调了在“审慎对齐”方面的进展,通过逐步推理安全策略来提高AI安全性。

(The Verge)

via 茶馆 - Telegram Channel
High error rate for Dall-e & Moderation API

Dec 20, 11:13 PST
Investigating - We are currently investigating this issue.

via OpenAI Status - Incident History
谷歌发布首个人工智能推理模型

当地时间12月19日,谷歌发布实验性的“Gemini 2.0 Flash Thinking”模型,这是谷歌首个AI推理模型。该模型能明确展现自己的思考过程,来解决复杂的问题,推理能力更强。该模型目前已在Google AI Studio和Vertex AI平台上线。谷歌表示,这只是推理之旅的第一步,未来这些推理能力可能会集成到Gemini 2.0系列主要模型中。

—— 财联社、Techcrunch

via 风向旗参考快讯 - Telegram Channel
🤖 谷歌搜索即将整合AI模式,挑战竞争对手

谷歌正在研发一款名为“AI模式”的搜索引擎新功能,该功能将通过搜索结果页面上的新标签页提供类似Gemini的聊天机器人界面。测试版显示,用户可以提出后续问题,系统会同时显示AI生成的答案和相关的网络链接。此举旨在应对来自OpenAI等竞争对手的压力,这些竞争对手已将AI整合到其搜索产品中。该功能预计还将支持语音搜索。

(The Verge)

via 茶馆 - Telegram Channel
Elevated errors for requests to Claude 3.0 Opus and Claude 3.5 Sonnet

Dec 20, 06:24 PST
Investigating - We are currently investigating elevated errors on requests to Claude 3.5 Sonnet on the API, Claude.ai, and the Anthropic Console.

via Anthropic Status - Incident History
腾讯与荣耀在AI和云计算领域达成战略合作

12月20日消息,最近,腾讯和荣耀在深圳正式签署战略合作协议。双方将长期合作,充分发挥荣耀在终端、人工智能和生态建设上的硬核实力,与腾讯在云计算、内容平台和游戏科技领域的强大资源深度结合,实现优势互补,共同成长。此前,腾讯与荣耀曾推出“荣耀 CoMagic 编码助手”,可以辅助开发人员编写、调试代码,提高开发效率。官方宣布,已经有超过8000名荣耀软件工程师使用人工智能辅助编程,将开发过程代码生成比例提升至30%,代码采纳率提升至25%。

—— 腾讯

via 风向旗参考快讯 - Telegram Channel
#GitHub #脚本 #工具

🗳️ AutoMoGuDingCheckIn - 工学云自动打卡脚本

▎项目功能:工学云自动打卡

▎项目介绍:一个工学云自动打卡脚本,旨在自动化工学云应用中的签到过程,自动提交月报、周报、日报。

支持多用户、自定义位置信息、保持登录状态、每日打卡检查、打卡位置浮动、消息推送,免服务器运行。

用户可以自定义打卡地点的详细信息,包括地址、经纬度等,支持自动提交日报、周报和月报,并与 AI 模型集成,可以生成周报、日报和月报, 支持 OpenAI 格式的 API。

支持多种推送通知方式,如 Server、PushPlus、SMTP 等,可根据需要配置推送设置,还支持每日打卡、节假日自动识别打卡和自定义打卡日。

▎项目地址:点击打开

via 资源分享 - Telegram Channel
ChatGPT 现可在 macOS 上直接与更多编程和笔记应用协同工作

ChatGPT 现已在 macOS 上支持更多编程和笔记应用,用户可通过语音或文本与这些应用直接交互。新增支持的应用包括 Warp、IntelliJ IDEA、PyCharm 等编程工具,以及 Apple Notes、Notion 和 Quip 等笔记应用。用户在使用这些应用时,还能享受 Advanced Voice 功能带来的便利,以及 o1 和 o1 pro 模型的强大功能。该功能目前处于 Beta 测试阶段,面向 Plus、Pro、Team、Enterprise 和 Edu 用户开放。OpenAI 计划于明年将此功能扩展至 Windows 和免费用户。

OpenAI

📮投稿 ☘️频道 🌸聊天

via 科技圈🎗在花频道📮 - Telegram Channel
谷歌发布新模型:Gemini 2.0 Flash Thinking

这个新模型的特色是能够展示其推理思考过程,同时保持Flash版本的高速处理能力。

该模型具备更强的推理能力,可以解决复杂问题,并能让用户看到模型的思考规划过程。这是继Gemini 2.0 Flash之后的新突破,进一步增强了模型的透明度和可解释性。

该模型已在Google AI Studio平台上线,开发者可以进行测试使用。 体验地址

📮投稿 ☘️频道 🌸聊天

via 科技圈🎗在花频道📮 - Telegram Channel
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]