ChatGPT / AI新闻聚合

https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8-4.2折支持OpenAI, Claude, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN

07:46 · 2024年12月21日 · 周六

🚨 苹果AI新闻摘要功能因错误报道遭批评

无国界记者组织（RSF）要求苹果公司移除其于12月11日在英国推出的AI驱动新闻摘要功能“Apple Intelligence”，原因是该功能存在不准确性。该系统错误地报道了据称为UnitedHealth枪手的Luigi Mangione去世（实际上他仍然健在）以及以色列总理本雅明·内塔尼亚胡被捕。这些由BBC投诉指出的错误引发了对虚假信息传播的担忧。RSF批评欧盟《人工智能法案》未将生成信息的AI归类为“高风险”，导致法律空白。苹果CEO蒂姆·库克承认，该AI容易出现“幻觉”——即捏造的信息问题。类似的问题也困扰着其他AI系统，包括谷歌的Gemini和X公司的Grok。

(PCMag.com)

via 茶馆 - Telegram Channel

07:04 · 2024年12月21日 · 周六

OpenAI 发布推理模型 o3 和 o3-mini

周五，在“OpenAI 12天活动”的第12天，首席执行官萨姆·奥尔特曼宣布了其最新的人工智能“推理”模型o3和o3-mini，这两款模型是在今年早些时候推出的o1模型的基础上开发的。该公司尚未发布这些模型，但今天将使这些模型可用于公共安全测试和研究。就像o1一样，o3是一个模型家族，o3-mini是一款更小的精简版模型，专门针对特定任务进行了微调。OpenAI声称，至少在某些条件下，o3可以接近实现AGI。OpenAI总裁Greg Brockman表示，最新的推理模型o3是一个突破，在最困难的基准上有了阶跃函数的改进。现在开始安全测试和红队演练。

—— 财联社、新浪财经、OpenAI

via 风向旗参考快讯 - Telegram Channel

04:44 · 2024年12月21日 · 周六

💰 数据砖公司融资100亿美元，AI人才争夺战白热化

数据分析公司Databricks获得创纪录的100亿美元融资，主要用于员工股票变现，凸显了人工智能人才争夺战的激烈程度。全球能够创建前沿模型的顶尖研究人员估计不足1000人，他们以及基础设施专家成为各大科技公司争抢的对象。OpenAI、Anthropic、亚马逊、谷歌、Meta、xAI和微软等公司都在积极争夺这些稀缺人才。虽然基础设施支持方面的人才库正在扩大，但顶级研究人员仍然炙手可热，导致AI公司估值大幅上涨。文章还指出，大型语言模型（LLM）的改进速度可能正在放缓，焦点正转向更好地利用现有模型进行商业应用。其他新闻包括谷歌削减管理层10%，Meta取消免费电动汽车充电，以及多家科技公司高管变动（例如Alec Radford离开OpenAI，Grammarly与Coda合并）。今年全球移动应用支出增长15.7%，下载量下降2.3%。

(The Verge)

via 茶馆 - Telegram Channel

04:44 · 2024年12月21日 · 周六

📈 OpenAI o3模型在AI适应性方面取得突破性进展

OpenAI最新研发的o3系统在ARC-AGI-Pub半私有评估集上取得了75.7%的惊人成绩，显著超过了之前的基准。使用172倍的计算资源后，o3的得分更是达到了87.5%。这标志着人工智能在适应新任务能力方面取得了实质性飞跃，超越了之前的GPT模型。虽然在低计算模式下每次任务的成本高达17-20美元，但这项突破表明，在该领域实现人类水平的性能在经济上很快就会可行。旨在实现85%开源解决方案的ARC奖项将于2025年第一季度启动ARC-AGI-2，这是一个更具挑战性的基准，旨在进一步推动人工智能的能力。o3的成功突显了新型架构相较于简单地扩展现有模型的重要性。

(HackerNews)

via 茶馆 - Telegram Channel

04:44 · 2024年12月21日 · 周六

今天，我们分享了关于我们o模型推理系列中下一个模型早期版本的评估：OpenAI o3。

(@OpenAI)

via 茶馆 - Telegram Channel

04:44 · 2024年12月21日 · 周六

🚀OpenAI发布强大推理模型o3，性能大幅提升

OpenAI发布了新型人工智能推理模型o3和o3-mini，其性能显著优于前代模型。在SWE-Bench Verified编码测试中，o3的性能提升了22.8%，甚至在编程竞赛中超越了OpenAI的首席科学家。在2024年AIME数学竞赛中，o3几乎取得了满分（仅错一题），并在专家级科学基准测试GPQA Diamond中取得了87.7%的成绩。更令人瞩目的是，o3解决了25.2%的最难数学和推理问题，远超其他模型（低于2%）的水平。虽然o3目前尚未公开发布，但OpenAI正在接受研究申请，以获取早期访问权限。OpenAI还强调了在“审慎对齐”方面的进展，通过逐步推理安全策略来提高AI安全性。

(The Verge)

via 茶馆 - Telegram Channel

03:19 · 2024年12月21日 · 周六

High error rate for Dall-e & Moderation API

Dec 20, 11:13 PST
Investigating - We are currently investigating this issue.

via OpenAI Status - Incident History

00:57 · 2024年12月21日 · 周六

谷歌发布首个人工智能推理模型

当地时间12月19日，谷歌发布实验性的“Gemini 2.0 Flash Thinking”模型，这是谷歌首个AI推理模型。该模型能明确展现自己的思考过程，来解决复杂的问题，推理能力更强。该模型目前已在Google AI Studio和Vertex AI平台上线。谷歌表示，这只是推理之旅的第一步，未来这些推理能力可能会集成到Gemini 2.0系列主要模型中。

—— 财联社、Techcrunch

via 风向旗参考快讯 - Telegram Channel

22:40 · 2024年12月20日 · 周五

🤖 谷歌搜索即将整合AI模式，挑战竞争对手

谷歌正在研发一款名为“AI模式”的搜索引擎新功能，该功能将通过搜索结果页面上的新标签页提供类似Gemini的聊天机器人界面。测试版显示，用户可以提出后续问题，系统会同时显示AI生成的答案和相关的网络链接。此举旨在应对来自OpenAI等竞争对手的压力，这些竞争对手已将AI整合到其搜索产品中。该功能预计还将支持语音搜索。

(The Verge)

via 茶馆 - Telegram Channel

22:25 · 2024年12月20日 · 周五

Elevated errors for requests to Claude 3.0 Opus and Claude 3.5 Sonnet

Dec 20, 06:24 PST
Investigating - We are currently investigating elevated errors on requests to Claude 3.5 Sonnet on the API, Claude.ai, and the Anthropic Console.

via Anthropic Status - Incident History

22:16 · 2024年12月20日 · 周五

微软开源了一款金融市场预测工具 MarS 能够实现逼真的市场模拟

via XiaoHu.AI学院 (author: 小互)

Telegraph

微软开源了一款金融市场预测工具 MarS 能够实现逼真的市场模拟

MarS（Market Simulation）是微软研究院开发的一款金融市场模拟引擎，基于一种生成式模型——大型市场模型（Large Market Model, LMM）。它通过基于真实订单级别的历史金融市场数据训练，可以生成逼真、可控且具有交互性的市场订单序列，帮助研究人员和从业者在虚拟环境中模拟和测试金融市场行为。 MarS可用于多种下游应用，包括市场趋势预测、异常检测系统、市场影响分析以及强化学习环境等。例如，在市场趋势预测中，MarS的模拟显著优于传统的直接预测模型，体现了其对市场动态的深刻理解。

18:46 · 2024年12月20日 · 周五

腾讯与荣耀在AI和云计算领域达成战略合作

12月20日消息，最近，腾讯和荣耀在深圳正式签署战略合作协议。双方将长期合作，充分发挥荣耀在终端、人工智能和生态建设上的硬核实力，与腾讯在云计算、内容平台和游戏科技领域的强大资源深度结合，实现优势互补，共同成长。此前，腾讯与荣耀曾推出“荣耀 CoMagic 编码助手”，可以辅助开发人员编写、调试代码，提高开发效率。官方宣布，已经有超过8000名荣耀软件工程师使用人工智能辅助编程，将开发过程代码生成比例提升至30%，代码采纳率提升至25%。

—— 腾讯

via 风向旗参考快讯 - Telegram Channel

12:37 · 2024年12月20日 · 周五

#GitHub #脚本 #工具

🗳️ AutoMoGuDingCheckIn - 工学云自动打卡脚本

▎项目功能：工学云自动打卡

▎项目介绍：一个工学云自动打卡脚本，旨在自动化工学云应用中的签到过程，自动提交月报、周报、日报。

支持多用户、自定义位置信息、保持登录状态、每日打卡检查、打卡位置浮动、消息推送，免服务器运行。

用户可以自定义打卡地点的详细信息，包括地址、经纬度等，支持自动提交日报、周报和月报，并与 AI 模型集成，可以生成周报、日报和月报，支持 OpenAI 格式的 API。

支持多种推送通知方式，如 Server、PushPlus、SMTP 等，可根据需要配置推送设置，还支持每日打卡、节假日自动识别打卡和自定义打卡日。

▎项目地址：点击打开

via 资源分享 - Telegram Channel

09:35 · 2024年12月20日 · 周五

ChatGPT 现可在 macOS 上直接与更多编程和笔记应用协同工作

ChatGPT 现已在 macOS 上支持更多编程和笔记应用，用户可通过语音或文本与这些应用直接交互。新增支持的应用包括 Warp、IntelliJ IDEA、PyCharm 等编程工具，以及 Apple Notes、Notion 和 Quip 等笔记应用。用户在使用这些应用时，还能享受 Advanced Voice 功能带来的便利，以及 o1 和 o1 pro 模型的强大功能。该功能目前处于 Beta 测试阶段，面向 Plus、Pro、Team、Enterprise 和 Edu 用户开放。OpenAI 计划于明年将此功能扩展至 Windows 和免费用户。

OpenAI

📮投稿 ☘️频道 🌸聊天

via 科技圈🎗在花频道📮 - Telegram Channel

08:50 · 2024年12月20日 · 周五

https://mp.weixin.qq.com/s/XjYh3y6uiDTDvN6uo4JZpA

Weixin Official Accounts Platform

重磅！OpenAI再遭人事动荡，GPT之父离职

06:25 · 2024年12月20日 · 周五

谷歌发布新模型：Gemini 2.0 Flash Thinking

这个新模型的特色是能够展示其推理思考过程，同时保持Flash版本的高速处理能力。

该模型具备更强的推理能力，可以解决复杂问题，并能让用户看到模型的思考规划过程。这是继Gemini 2.0 Flash之后的新突破，进一步增强了模型的透明度和可解释性。

该模型已在Google AI Studio平台上线，开发者可以进行测试使用。体验地址

📮投稿 ☘️频道 🌸聊天

via 科技圈🎗在花频道📮 - Telegram Channel

Before

After

Home