https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持Deepseek、OpenAI(o3/GPTs/Sora/实时语音)、Claude、Gemini、Midjourney、文件上传
Buy ads: https://telega.io/c/AI_News_CN
OpenAI未能在2025年前提供承诺的退出工具

早在五月,OpenAI 公司就表示正在开发一款工具,让创作者可以指定他们希望自己的作品如何纳入或排除在 AI 训练数据之外。但七个月过去了,这款工具仍未面世。OpenAI 当时说,该工具名为“媒体管理器”,可以识别受版权保护的文本、图像、音频和视频,以反映创作者“跨多个来源”的偏好。

但知情人士称,该工具在内部很少被视为重要发布。一位前 OpenAI 员工说:“我不认为这是一个优先事项。说实话,我不记得有人在开发它。”一位负责与公司协调工作的非员工12月表示,他们过去曾与 OpenAI 讨论过该工具,但最近没有任何更新。OpenAI 错过了2025年前推出这款工具的最后期限。

—— Techcrunch

via 风向旗参考快讯 - Telegram Channel
🧮 普特南数学竞赛揭示大型语言模型推理能力缺陷

一项名为Putnam-AXIOM的新基准测试,使用来自普特南数学竞赛的236道复杂数学题对大型语言模型(LLM)进行了评估。结果显示,即使是像OpenAI的o1-preview这样的顶级模型,其在原始问题上的准确率也仅为41.95%。为了减少数据污染的影响,研究人员还创建了一个变体基准测试。结果显示,当模型面对功能上有所改变但难度相当的问题时,准确率下降了约30%。 这突显了当前LLM在推理能力方面的显著不足以及训练数据偏差的影响。该研究已提交给ICLR 2025(投稿编号:86)。

(HackerNews)

via 茶馆 - Telegram Channel
💰 英伟达2024年AI投资激增至10亿美元

英伟达2024年在人工智能初创企业和公司交易中投资了10亿美元,比2023年的8.72亿美元大幅增加。这笔投资涵盖了50轮融资,主要面向对计算能力要求极高的“核心AI”公司,这些公司通常使用英伟达的GPU。由于对图形处理单元的需求激增,英伟达的市值在6月份超过了3万亿美元。投资对象包括OpenAI、Cohere、Mistral、Perplexity和埃隆·马斯克的xAI等知名公司,并收购了Run:ai和Nebulon等几家AI软件公司。尽管面临微软和谷歌等科技巨头开发定制芯片以减少对英伟达产品依赖的竞争,但英伟达仍在通过其Inception孵化器计划等举措支持规模较小的AI公司。英伟达的积极扩张战略引发了对其潜在垄断行为的担忧,但英伟达辩称这是为了增强其生态系统,而不会对合作伙伴施加技术使用要求。值得注意的是,在英伟达早期支持下,CoreWeave正准备进行IPO,估值高达350亿美元。英伟达的举动凸显了其在塑造人工智能未来格局中的关键作用,同时也面临着全球监管机构的挑战。

(FT)

via 茶馆 - Telegram Channel
🤖 AI 机器人爬虫攻陷去中心化社交网络 diaspora*,开发者怒斥DDoS攻击

去中心化社交网络 diaspora* 项目开发者近日披露,其论坛、维基和项目网站的流量高达70% 来自于 AI 公司的机器人程序,过去60天共收到1130万次请求(平均每秒2.19次)。其中,OpenAI 的 gptbot 机器人爬虫贡献了24.6% 的请求,亚马逊贡献了17.1%,Anthropic 贡献了4.3%,Meta 贡献了2.2%。而谷歌和必应的搜索引擎爬虫占比仅为0.14%。开发者对此表示强烈谴责,认为这些 AI 公司的爬虫无视 robots.txt 协议,持续尝试索引所有页面,并通过切换IP和伪装User Agent绕过封锁,构成对整个互联网的DDoS攻击。

(科技情报)

via 茶馆 - Telegram Channel
WPS Office PC端中国日活设备数突破1亿

金山办公1月1日宣布,WPS Office的PC端中国日活设备数突破1亿。金山办公表示,要特别感谢每一位用户的支持,在公司步入37岁时,成为一款日活破亿的办公软件。

金山办公自1988年成立至今,已经步入第37年。旗下产品WPS Office作为国民办公软件影响力巨大,用户覆盖全球220多个国家和地区。在2024年,金山办公面向企业和组织推出了办公新质生产力平台WPS 365,包含WPS Office、WPS AI企业版和WPS 协作,打通文档、AI、协作三大能力。同年,金山办公旗下基于大语言模型的智能办公助手WPS AI也升级迭代至2.0版本,包含WPS AI办公助手、WPS AI企业版、WPS AI政务版。

—— 凤凰网科技

via 风向旗参考快讯 - Telegram Channel
AI性能测试出现新潮流:从史密斯吃意面到我的世界建筑

2024年出现多个趣味性AI测试方法,包括"威尔·史密斯吃意面测试"用于评估AI视频真实感,以及在我的世界中测试AI建造能力的应用。此外还出现了AI对战连连看和你画我猜的评估平台。

这些非传统测试方法相比专业的AI性能评估更易被普通用户理解,虽然不够严谨但更具趣味性和普及性。沃顿商学院教授Ethan Mollick认为,这反映了当前AI评估缺乏与普通人能力对比的问题。

TechCrunch

📮投稿☘️频道🌸聊天

via 科技圈🎗在花频道📮 - Telegram Channel
百度上线AI搜,通过@ 与不同智能体交互

百度近日在百度搜索Web端首页上线了百度“AI搜”入口,推动百度搜索改版升级。

据悉,“AI搜”基于百度文心大模型打造的桌面端AI搜索引擎,目前内容侧已经打通百度搜索引擎、百度健康、百度律临、百度文库、百度教育等内容生态,可确保搜索结果可靠、权威。

新浪科技

📮投稿 ☘️频道 🌸聊天

via 科技圈🎗在花频道📮 - Telegram Channel
百度搜索网页增设搜索产品:上线“AI搜”

百度近日在百度搜索网页端首页上线了百度“AI搜”入口,推动百度搜索改版升级。“AI搜”基于原百度搜索AI伙伴改版升级而来,在此前的基础上做功能升级。“AI搜”是基于百度文心大模型打造的桌面端AI搜索引擎,目前内容侧已经打通百度搜索引擎、百度健康、百度律临、百度文库、百度教育等内容生态。

目前百度“AI搜”主要提供包括话题探索、问题解决、决策辅助、知识答疑、主题研究、学习创作等功能,覆盖文生图、文生文、逻辑推理、多轮对话、智能摘要、AI修图等AI技术。 此外,百度“AI搜”也提供了文心智能体入口,在对话框中可通过@方式与不同智能体进行交互,方便用户使用和创建智能体。

—— 新浪科技

via 风向旗参考快讯 - Telegram Channel
#GitHub #AI #工具

💬 Codai - 基于命令行的开源 AI 代码助手

▎项目介绍:一个 AI 代码助手,旨在通过基于会话的命令行界面帮助开发者高效地完成任务,如添加新功能、重构代码和执行详细的代码审查。

它的特点在于可以对整个项目上下文的深刻理解,能够分析代码库并基于上下文提供改进建议或生成新代码。

它支持多个 LLM 提供商,例如 OpenAI、Azure OpenAI、Ollama、Anthropic 和 OpenRouter,以简化日常开发任务。

▎项目地址:点击打开

via 资源分享 - Telegram Channel
Elevated error rate on Claude 3 Opus

Dec 31, 20:23 PST
Investigating - We are currently investigating this issue.

via Anthropic Status - Incident History
💰 2024大型语言模型:机遇与挑战并存

2024年,大型语言模型(LLM)如ChatGPT和Claude Sonnet的应用日益广泛,但也面临诸多挑战。虽然有人认为它们只是“无用的玩具”,但另一些用户则发现它们在编程辅助、设计协作和自动化日常任务等方面极具价值,例如一位非专业程序员利用LLM开发的Swift应用每月产生10200美元的经常性收入。

LLMs的有效性取决于提示词的精确性,但“幻觉”问题(生成错误或无意义信息)依然存在,需要持续的人工监督。Claude Sonnet 3.5在某些应用中表现优于其他版本,但市场宣传与实际能力的差距也引发了质疑。

经济方面,由于谷歌和亚马逊等科技巨头的竞争,AI服务的成本正在下降,但日益增长的计算需求带来的环境影响以及AGI(通用人工智能)普及后的经济影响仍是担忧。

总而言之,LLMs在正确应用下已证明其在各个领域的实用性,并带来了显著的生产力提升,但将其整合到工作流程中需要仔细权衡其技术能力和更广泛的社会影响。

(HackerNews)

via 茶馆 - Telegram Channel
阿里云通义千问视觉理解模型降价超80%

12 月 31 日,阿里云宣布本年度第三轮大模型降价,通义千问视觉理解模型全线降价超 80%。据悉,其中 Qwen-VL-Plus 直降 81%,输入价格仅为 0.0015 元/千 tokens,创下全网最低价格;更高性能的 Qwen-VL-Max 降至 0.003 元/千 tokens,降幅高达 85%。目前,按照最新价格,1 块钱可最多处理约 600 张 720P 图片,或 1700 张 480P 图片。据介绍,Qwen-VL 是阿里云研发的大规模视觉语言模型。Qwen-VL 可以以图像、文本、检测框作为输入,并以文本和检测框作为输出。

—— 每日经济新闻第一财经

via 风向旗参考快讯 - Telegram Channel
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]