https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
OpenAI首席执行官奥特曼:失败时我不希望政府来帮忙
OpenAI 首席执行官萨姆・奥特曼(Sam Altman)近日发表了一番引人注目的言论,他表示如果 OpenAI 将来遭遇失败,他并不希望美国政府出手相助。这一观点在业内引起了广泛讨论,也让外界对公司的未来发展产生了更多的关注。
11月6日,奥特曼在社交媒体上阐述了他的观点,这一时机恰巧是在 OpenAI 首席财务官莎拉・弗赖尔(Sarah Friar)先前提出希望政府能为公司基础设施借贷提供担保之后。弗赖尔的这一提议旨在降低公司的贷款成本,同时支持先进芯片的使用,但随之而来的是不少质疑声。知名硅谷投资人大卫・萨克斯(David Sacks)也在之后表示,政府不太可能对人工智能公司进行救助。
对于这一切,奥特曼进行了明确回应,他表示 OpenAI 并不寻求、也不希望政府为数据中心的建设提供担保。他认为,政府不应在市场中选择赢家与输家,同时纳税人也不应该为企业的失败买单。他还指出,当前关于担保贷款的讨论主要集中在美国的半导体工厂建设,并与 OpenAI 无直接关系。
尽管面临外部环境的挑战,奥特曼对 OpenAI 的未来依然充满信心。他预计公司在2023年的收入将达到200亿美元,计划在2030年前实现数千亿美元的增长目标。他强调,OpenAI 在多个领域的前景非常乐观,未来的成长潜力巨大。
奥特曼的这一立场不仅显示了他对公司财务状况的信心,也强调了企业在市场竞争中的自主责任。他希望企业能够通过自身的努力来应对挑战,而不是依赖于外部的救助。这番话语无疑为当前的市场环境带来了新的思考,也提醒各界关注企业的责任与创新。
via AI新闻资讯 (author: AI Base)
OpenAI 首席执行官萨姆・奥特曼(Sam Altman)近日发表了一番引人注目的言论,他表示如果 OpenAI 将来遭遇失败,他并不希望美国政府出手相助。这一观点在业内引起了广泛讨论,也让外界对公司的未来发展产生了更多的关注。
11月6日,奥特曼在社交媒体上阐述了他的观点,这一时机恰巧是在 OpenAI 首席财务官莎拉・弗赖尔(Sarah Friar)先前提出希望政府能为公司基础设施借贷提供担保之后。弗赖尔的这一提议旨在降低公司的贷款成本,同时支持先进芯片的使用,但随之而来的是不少质疑声。知名硅谷投资人大卫・萨克斯(David Sacks)也在之后表示,政府不太可能对人工智能公司进行救助。
对于这一切,奥特曼进行了明确回应,他表示 OpenAI 并不寻求、也不希望政府为数据中心的建设提供担保。他认为,政府不应在市场中选择赢家与输家,同时纳税人也不应该为企业的失败买单。他还指出,当前关于担保贷款的讨论主要集中在美国的半导体工厂建设,并与 OpenAI 无直接关系。
尽管面临外部环境的挑战,奥特曼对 OpenAI 的未来依然充满信心。他预计公司在2023年的收入将达到200亿美元,计划在2030年前实现数千亿美元的增长目标。他强调,OpenAI 在多个领域的前景非常乐观,未来的成长潜力巨大。
奥特曼的这一立场不仅显示了他对公司财务状况的信心,也强调了企业在市场竞争中的自主责任。他希望企业能够通过自身的努力来应对挑战,而不是依赖于外部的救助。这番话语无疑为当前的市场环境带来了新的思考,也提醒各界关注企业的责任与创新。
via AI新闻资讯 (author: AI Base)
谷歌公司在近期宣布推出 Magika1.0,这是其基于人工智能的文件类型检测系统的最新稳定版本。此次版本的发布,标志着 Magika 在性能和安全性方面的重大提升,因为核心引擎已全面迁移至 Rust 语言。自去年开源以来,Magika 已经在开源社区中获得了广泛应用,每月下载量超过100万次。
新版 Magika 的架构进行了全面重构,显著提高了处理速度和内存安全性。谷歌表示,这款工具能够在单核处理器下每秒识别数百个文件,借助多核 CPU 则可扩展至每秒数千个文件。Magika1.0采用 ONNX Runtime 进行模型推理,并利用 Tokio 框架实现异步处理,确保其高效运行。
在文件格式的支持方面,Magika1.0的检测能力已经扩展到200多种文件格式,几乎是初始版本的两倍。新增的文件类型包括数据科学与机器学习中的 Jupyter Notebooks、Numpy、PyTorch 等,以及现代编程和网页开发中的 Swift、Kotlin、TypeScript 等。此外,还支持 DevOps 相关文件和多种数据库及图形格式文件,如 SQLite 和 AutoCAD。
Magika1.0不仅提升了对相似格式文件的识别能力,还改善了对不同编程语言文件的区分,如 C 与 C++、JavaScript 与 TypeScript 等。谷歌在技术实现方面也面临诸多挑战,包括训练数据的庞大规模和部分文件类型样本稀缺。为此,谷歌开发了自有的数据集库 SedPack,并通过生成式 AI 工具 Gemini 创造高质量的合成训练数据,以提升模型的泛化能力。
值得注意的是,Magika 还更新了 Python 与 TypeScript 模块,使得开发者可以更轻松地进行集成。用户可以通过简单命令在不同操作系统上安装 Magika,并且谷歌鼓励开发者参与到该项目中来,继续优化与扩展工具的功能。
划重点:
🌟 Magika1.0采用 Rust 语言重构,性能与安全性大幅提升。
📂 支持200多种文件格式,新增多种数据科学与编程语言类型。
⚙️ 简化开发者集成过程,鼓励社区参与项目优化。
via AI新闻资讯 (author: AI Base)
社交平台 X(原 Twitter)最近开始大规模采用人工智能(AI)进行内容核查,提升用户对信息的信任度。据哥伦比亚新闻评论(CJR)报道,约有10% 的 “社区注释” 是由八个 AI 机器人生成的,这些机器人通过官方 API 为平台贡献内容。
图源备注:图片由AI生成
今年10月,一段与 “No Kings” 抗议活动相关的视频在社交媒体上广泛传播。某 AI 机器人为一条显示波士顿人群的 MSNBC 片段添加了注释,错误地指出该视频拍摄于2017年。尽管该注释尚未经过平台审核,部分用户仍然截图并传播,甚至有美国参议员引用,引发了对媒体操控的质疑。经过 Fact-checking 后发现,该视频实际上拍摄于2025年10月,这一事件表明社交平台的事实核查时代正经历巨变。
自从埃隆・马斯克收购 Twitter 以来,平台的事实核查团队大幅裁减,转向 “社区注释” 模式,依赖普通用户提供和验证信息。从9月开始,AI 正式参与这一过程,用户只需具备验证的手机和邮箱,就可以创建自己的 AI 机器人来协助核查。社区注释系统采用共识机制,只有经过用户投票认可的注释才能公开展示,而未获得共识的注释将不被显示。
尽管 AI 的参与为平台带来了新鲜的变化,但有研究指出,自9月以来,超过四分之三的社区注释(无论是由人还是 AI 撰写)都未获得评级,无法对外公开。这表明 AI 注释在质量上尚未达到预期效果。有些 AI 注释甚至出现了明显错误,例如将现任总统特朗普错误地称为 “前总统” 或 “普通公民”,这些错误最终通过人工投票被否决。
调查还发现,部分 AI 账户在短时间内产生大量注释,积极警示用户识别虚假信息。其中,“Zesty Walnut Grackle” 曾主动修正自己的错误,并公开承认原注释的失误,显示出一定的自我纠错能力。X 平台的这一转变,标志着社交媒体事实核查机制的重大改革。
划重点:
📰 约10% 的 “社区注释” 由 AI 生成,提升信息核查效率。
🔍 近期传播的视频被 AI 错误注释,引发媒体操控质疑。
🤖 AI 与社区用户共同参与核查,提升信息的真实度与可信性。
via AI新闻资讯 (author: AI Base)
AMD CEO 透露:多家OpenAI 级别客户争相采购AI芯片
在最新的第三季度财报电话会议上,AMD 首席执行官苏姿丰(Dr. Lisa Su)分享了公司与 OpenAI 合作的最新进展,并透露目前有多家客户正排队希望与 AMD 建立类似规模的合作关系。这一消息不仅彰显了 AMD 在人工智能市场中的重要地位,也引发了业界的广泛关注。
苏姿丰表示,与 OpenAI 的合作将为 AMD 带来巨额的营收,预计这一交易将为公司创造高达1000亿美元的收入。这一成功的合作提升了其他客户的兴趣,AMD 正积极谋划与多家潜在客户进行类似的合作,以确保其客户基础的广泛性,从而降低客户集中度带来的风险。
AMD 目前正在全力以赴开发 Instinct MI450等 AI 芯片。这些新芯片在架构上进行了改进,提升了能效,力求在机架级配置上也持续发力。根据苏姿丰的介绍,Instinct MI355系列芯片的产量已经开始提升,强劲的增长势头预计将持续到2026年,而 MI450系列芯片则预计将在明年下半年正式上市。
此外,苏姿丰还透露,AMD 已经获得了 MI308AI 芯片的对华出口许可,尽管该芯片的官方参数尚未公布,但业内人士普遍认为其性能将与 NVIDIA H20相当。这一消息无疑为 AMD 在竞争激烈的 AI 市场增添了更多的筹码。
AMD 正在加大对人工智能领域的投资,通过不断推出新产品来缩小与竞争对手 NVIDIA 之间的差距。随着 AI 技术的快速发展,AMD 在数据中心和 AI 业务方面的表现将会受到越来越多的关注。
via AI新闻资讯 (author: AI Base)
在最新的第三季度财报电话会议上,AMD 首席执行官苏姿丰(Dr. Lisa Su)分享了公司与 OpenAI 合作的最新进展,并透露目前有多家客户正排队希望与 AMD 建立类似规模的合作关系。这一消息不仅彰显了 AMD 在人工智能市场中的重要地位,也引发了业界的广泛关注。
苏姿丰表示,与 OpenAI 的合作将为 AMD 带来巨额的营收,预计这一交易将为公司创造高达1000亿美元的收入。这一成功的合作提升了其他客户的兴趣,AMD 正积极谋划与多家潜在客户进行类似的合作,以确保其客户基础的广泛性,从而降低客户集中度带来的风险。
AMD 目前正在全力以赴开发 Instinct MI450等 AI 芯片。这些新芯片在架构上进行了改进,提升了能效,力求在机架级配置上也持续发力。根据苏姿丰的介绍,Instinct MI355系列芯片的产量已经开始提升,强劲的增长势头预计将持续到2026年,而 MI450系列芯片则预计将在明年下半年正式上市。
此外,苏姿丰还透露,AMD 已经获得了 MI308AI 芯片的对华出口许可,尽管该芯片的官方参数尚未公布,但业内人士普遍认为其性能将与 NVIDIA H20相当。这一消息无疑为 AMD 在竞争激烈的 AI 市场增添了更多的筹码。
AMD 正在加大对人工智能领域的投资,通过不断推出新产品来缩小与竞争对手 NVIDIA 之间的差距。随着 AI 技术的快速发展,AMD 在数据中心和 AI 业务方面的表现将会受到越来越多的关注。
via AI新闻资讯 (author: AI Base)
OpenAI 于本周四发布了一份针对青少年使用人工智能的安全标准蓝图,旨在引导公众和立法者关注青少年在使用 AI 时的安全问题。
这份蓝图首次与 Axios 共享,正值多个州正在考虑制定 AI 安全法案之际,特别是美国参议院也在推进一项禁止未成年人使用聊天机器人的法案。与此同时,OpenAI 面临一宗涉及未成年人自杀的高调诉讼,这引发了公众对其平台在青少年用户安全防护方面的广泛关注。
图源备注:图片由AI生成
OpenAI 在推动 AI 技术应用于学校的同时,认为设定相关安全框架尤为重要。该蓝图提出,青少年应能安全、可信地接触 AI,并防范潜在的伤害。具体来说,OpenAI 建议 ChatGPT 应根据用户年龄的不同,做出差异化的回应,以便更好地保护青少年。例如,15岁的青少年和成年人在使用 AI 时的互动应有所不同。
在蓝图中,OpenAI 列出了五项针对青少年保护的具体建议。这些建议包括:识别平台上的青少年用户,并以适合其年龄的方式进行处理;通过相关政策,禁止 AI 系统展示自杀、自残及敏感或暴力内容,避免鼓励危险行为或不切实际的身体标准;在无法确认用户年龄的情况下,默认将其视为未满18岁进行处理;为家庭提供家长控制工具,以便家长可以管理青少年账户的使用情况;以及拓展基于最新研究成果的防护功能,保护青少年与 AI 的互动。
不过,年龄验证技术仍然面临挑战,许多未成年人可能会轻易绕过现有规则。为了提高青少年用户的安全性,OpenAI 正在探索多种措施,并希望能推动更多家庭和学校共同参与 AI 的规范及监督工作。
划重点:
🌐 OpenAI 发布青少年人工智能安全标准蓝图,关注青少年安全问题。
🛡️ 蓝图建议根据用户年龄差异化处理 AI 交互,保护青少年。
👨👩👧👦 提出五项建议,包括家长控制工具,强化青少年使用安全。
via AI新闻资讯 (author: AI Base)
谷歌财经向股票交易者提供Gemini AI工具
谷歌将人工智能融入所有领域的成熟战略仍在继续:该公司周四宣布,谷歌财经将获得深度搜索功能,以增强其AI聊天机器人,同时还将进行其他升级以支持交易者,如预测市场支持。新的深度搜索功能将让您从谷歌财经的内置AI聊天机器人获得更详细的回复并提出更复杂的问题,该聊天机器人是作为今年早些时候应用人工智能改造的一部分推出的。要使用该功能,您只需在提问时选择 “深度搜索” 选项。搜索产品总监罗伯特·邓内特表示,该工具使用谷歌先进的Gemini AI模型,能够在几分钟内生成一份完整引用、全面的回答。还将显示研究计划,以便您能跟随并更好地理解人工智能的推理过程。
—— The Verge
via 风向旗参考快讯 - Telegram Channel
谷歌将人工智能融入所有领域的成熟战略仍在继续:该公司周四宣布,谷歌财经将获得深度搜索功能,以增强其AI聊天机器人,同时还将进行其他升级以支持交易者,如预测市场支持。新的深度搜索功能将让您从谷歌财经的内置AI聊天机器人获得更详细的回复并提出更复杂的问题,该聊天机器人是作为今年早些时候应用人工智能改造的一部分推出的。要使用该功能,您只需在提问时选择 “深度搜索” 选项。搜索产品总监罗伯特·邓内特表示,该工具使用谷歌先进的Gemini AI模型,能够在几分钟内生成一份完整引用、全面的回答。还将显示研究计划,以便您能跟随并更好地理解人工智能的推理过程。
—— The Verge
via 风向旗参考快讯 - Telegram Channel
↩️ 上海首例 AI 提示词著作权案宣判:提示词不构成作品
上海首例 AI 提示词著作权案宣判:提示词不构成作品
上海市黄浦区人民法院今日对首例涉 AI 提示词著作权侵权案作出一审判决,驳回原告全部诉讼请求。原告公司 2022 年撰写六组提示词,包含艺术风格、主体元素等内容,用于在 Midjourney 平台生成绘画作品,后发现被告使用相同提示词生成近似画作并发布。
法院认为,涉案提示词虽包含多类元素,但各元素间仅为简单罗列,缺乏语法逻辑关联和个性化特征,所选用的艺术风格、材质细节等均属该领域常规表达,未体现作者独特的审美视角。提示词本质上属于抽象的创作构思和思想范畴,没有体现作者在表达层面的个性化智力投入,因此不应认定为作品。
上海高院
🍀在花频道 🍵茶馆 📮投稿新鲜事
via 科技圈🎗在花频道📮 - Telegram Channel
科技圈🎗在花频道📮:
北京首例 AI 制图侵权案宣判 北京市通州法院近日宣判首例利用人工智能制图侵犯著作权刑事案件。2024 年 3 月至 7 月,罗某等人组织他人用 AI 工具对他人原创画作进行细微修改后,批量生产拼图产品,在电商平台销售超 3000 件,非法获利 27 万元。2024 年 5 月,受害插画师张某报案,警方将涉案四人抓获归案,涉案财物被依法扣押。 法院认定被告单位及个人构成侵犯著作权罪,判处罚金共计 21 万元,罗某与姚某分别获刑一年六个月并处罚金,李某与王某获刑十个月缓刑一年。判决指出,AI 工具“微调…
上海首例 AI 提示词著作权案宣判:提示词不构成作品
上海市黄浦区人民法院今日对首例涉 AI 提示词著作权侵权案作出一审判决,驳回原告全部诉讼请求。原告公司 2022 年撰写六组提示词,包含艺术风格、主体元素等内容,用于在 Midjourney 平台生成绘画作品,后发现被告使用相同提示词生成近似画作并发布。
法院认为,涉案提示词虽包含多类元素,但各元素间仅为简单罗列,缺乏语法逻辑关联和个性化特征,所选用的艺术风格、材质细节等均属该领域常规表达,未体现作者独特的审美视角。提示词本质上属于抽象的创作构思和思想范畴,没有体现作者在表达层面的个性化智力投入,因此不应认定为作品。
上海高院
🍀在花频道 🍵茶馆 📮投稿新鲜事
via 科技圈🎗在花频道📮 - Telegram Channel
近日,OpenAI首席执行官(CEO)奥特曼在一档节目访谈中,发表了关于普通大学学位回报率变化以及“善于使用AI”重要性的观点。奥特曼指出,普通大学学位的回报率下降速度,将比过去十年更快一些。不过,他同时强调,这种下降“但不会像理论上应有的速度那样,迅速暴跌到零”。
期间,奥特曼并不认为巨大的回报会累计集中在少数从事AI相关工作的人身上。相反,他着重强调,善于运用AI所带来的回报,将会以一种出人意料的方式广泛分布开来。
在他看来,AI能够助力我们所有人探索新科学,很多人将从中受益,人们可能会基于AI带来的机遇创办公司,或者凭借AI获得新的工作机会,但他并不认为这是唯一的赚钱途径。
奥特曼认为,人们会把AI应用到各种类型的工作中,或者借助AI把现有的工作完成得更好。
为了更好地说明这一点,他以自己小时候的经历举例:当时他有一份工作,是教长辈如何使用Google。那时,长辈们很难理解“只要把内容输入进去,它就能给出结果”这一操作逻辑。
谈及AI发展,奥特曼认为ChatGPT能够迅速增长的原因之一,在于它容易上手使用,并且用户能够很快从中获得实际价值。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)
诉讼指控OpenAI怂恿自杀和助长有害妄想
美国和加拿大的多个家庭正在起诉OpenAI公司,声称他们的亲人因与该公司的聊天机器人ChatGPT互动而受到伤害。其中四人在互动后自杀身亡。周四在加州州法院提起的这七起诉讼称,一些人在与ChatGPT长时间对话后陷入妄想状态,有时甚至导致自杀。这些诉状的指控包括过失致死、协助自杀和非自愿过失杀人等。这些案件指控OpenAI仓促推出了其于2024年中发布的旗舰 GPT-4o AI 模型,诉讼称这一决定压缩了安全测试。诉讼还认为该公司在聊天机器人的设计中,将用户参与度和延长互动置于安全之上。原告方正寻求金钱赔偿以及对ChatGPT产品的修改,包括在讨论自杀方法时自动结束对话。
—— 华尔街日报
via 风向旗参考快讯 - Telegram Channel
美国和加拿大的多个家庭正在起诉OpenAI公司,声称他们的亲人因与该公司的聊天机器人ChatGPT互动而受到伤害。其中四人在互动后自杀身亡。周四在加州州法院提起的这七起诉讼称,一些人在与ChatGPT长时间对话后陷入妄想状态,有时甚至导致自杀。这些诉状的指控包括过失致死、协助自杀和非自愿过失杀人等。这些案件指控OpenAI仓促推出了其于2024年中发布的旗舰 GPT-4o AI 模型,诉讼称这一决定压缩了安全测试。诉讼还认为该公司在聊天机器人的设计中,将用户参与度和延长互动置于安全之上。原告方正寻求金钱赔偿以及对ChatGPT产品的修改,包括在讨论自杀方法时自动结束对话。
—— 华尔街日报
via 风向旗参考快讯 - Telegram Channel
Elevated errors for requests to Claude Sonnet 4.5
Nov 7, 06:57 UTC
Investigating - We are currently investigating this issue.
via Claude Status - Incident History
Nov 7, 06:57 UTC
Investigating - We are currently investigating this issue.
via Claude Status - Incident History
🚀 谷歌发布Magika 1.0:AI文件类型检测工具升级,速度与精度大幅提升
谷歌已发布其基于人工智能的文件类型检测工具Magika的稳定版本Magika 1.0。该工具的整个引擎已用Rust语言重写,显著提升了速度和内存安全性。Magika 1.0现在能够识别超过200种文件类型,是此前约100种的两倍,并能更精确地区分JSON与JSONL、TSV与CSV等相似格式。谷歌团队利用3TB的训练数据集,并借助Gemini为罕见文件类型生成合成样本,以增强其处理能力。此外,Magika 1.0支持Python和TypeScript集成,并提供原生的Rust命令行客户端。
(科技圈)
via 茶馆 - Telegram Channel
谷歌已发布其基于人工智能的文件类型检测工具Magika的稳定版本Magika 1.0。该工具的整个引擎已用Rust语言重写,显著提升了速度和内存安全性。Magika 1.0现在能够识别超过200种文件类型,是此前约100种的两倍,并能更精确地区分JSON与JSONL、TSV与CSV等相似格式。谷歌团队利用3TB的训练数据集,并借助Gemini为罕见文件类型生成合成样本,以增强其处理能力。此外,Magika 1.0支持Python和TypeScript集成,并提供原生的Rust命令行客户端。
(科技圈)
via 茶馆 - Telegram Channel
🤖OpenAI CEO奥尔特曼澄清政府兜底传闻,预计2030年营收达数千亿美元
OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)紧急澄清了此前首席财务官关于寻求政府为AI投资提供“兜底”或“担保”的言论,强调OpenAI不寻求政府为其数据中心提供担保,并表示纳税人不应救助决策失误的公司。他解释称,首席财务官的本意是美国政府应建立“国家战略算力储备”以服务公共利益。
为打消投资者对巨额AI支出的担忧(公司已签署超1.4万亿美元基础设施协议),奥尔特曼强调了OpenAI强大的创收能力。他表示,公司今年的年化营收有望超过200亿美元(高于首席财务官9月预测的130亿美元),并计划到2030年将销售额提升至数千亿美元。尽管OpenAI目前估值达5000亿美元,但尚未实现盈利。受此前言论影响,美国科技股周四集体下跌,纳指跌近2%。
(IT业界资讯)
via 茶馆 - Telegram Channel
OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)紧急澄清了此前首席财务官关于寻求政府为AI投资提供“兜底”或“担保”的言论,强调OpenAI不寻求政府为其数据中心提供担保,并表示纳税人不应救助决策失误的公司。他解释称,首席财务官的本意是美国政府应建立“国家战略算力储备”以服务公共利益。
为打消投资者对巨额AI支出的担忧(公司已签署超1.4万亿美元基础设施协议),奥尔特曼强调了OpenAI强大的创收能力。他表示,公司今年的年化营收有望超过200亿美元(高于首席财务官9月预测的130亿美元),并计划到2030年将销售额提升至数千亿美元。尽管OpenAI目前估值达5000亿美元,但尚未实现盈利。受此前言论影响,美国科技股周四集体下跌,纳指跌近2%。
(IT业界资讯)
via 茶馆 - Telegram Channel
根据牛津互联网研究院最新发布的一项研究,目前用于评估人工智能系统能力的方法常因缺乏科学严谨性而“高估”了AI的实际表现。该研究由牛津互联网研究院牵头,联合三十多位学者,对445项主流AI测试(即“基准测试”)进行了审查。研发者和研究人员常以这些基准测试来评价模型性能,并据此宣称技术进步。然而,此项研究认为这些基础测试本身的可靠性存在疑问,呼吁重新审视相关基准的有效性。
研究发现,许多顶级基准测试未能明确界定评测目标,频繁复用已有数据和测试方法,且很少采用可靠的统计方法比较不同模型结果。有作者指出,AI在被要求完成特定任务时,实际测量对象常常与预期目标并不一致。例如常用的GSM8K数学基准测试,虽然正确答案能显示模型基本算术能力,但未必能代表其真正的数学或推理水平。
研究还指出,半数基准未清晰定义所测量的概念,使测试结果难以真实反映AI模型在现实中的表现。作者建议,基准制定者应更清楚界定测试范畴,开发更具代表性的任务集,并以统计分析方式比较性能表现。
作为改善措施,论文提出八项建议,包括增加透明度和可信度的检查清单。目前已有人提出以更贴合现实需求的测试方式,如OpenAI推出的面向44种真实职业任务的新测试;中心安全团队也制定了用于评估远程工作自动化任务能力的新基准。
该研究认为,AI测试仍处于科学评估的初期阶段,需持续探索更有效的评测路径,以推动AI实际能力的客观判断。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
特斯拉首席执行官埃隆·马斯克在公司年度股东大会上表示,特斯拉将于2026年4月1日——也就是愚人节当天,发布第二代Roadster超级跑车的量产版。距离该项目首次亮相已过去近九年。
马斯克以频繁“跳票”著称,他在会上坦言选择愚人节是因为“这样可以给自己留些余地”,如果再次发生延期,“我可以说只是在开玩笑”。事实上,这意味着又一次推迟——就在一周前,马斯克在Joe Rogan播客节目中还声称计划在今年年底前展示新车。
马斯克强调新款Roadster“将与此前展示的车型有很大不同”,同时再次预告相关演示将是“史上最令人兴奋的,无论成功与否”,暗示多年来他一直在尝试让新Roadster具备某种飞行能力,甚至可能安装由SpaceX打造的推进器。
按照马斯克的说法,第二代Roadster量产预计将在2026年4月发布后的12至18个月内启动生产。
在股东问答环节中,有投资者询问能否让已预订“创始人系列”Roadster的客户参与发布会。这些客户在2017年支付了25万美元,抢订了特别版新车。马斯克回答表示,“当然可以,这是对长期耐心等待的Roadster预订者最起码的回馈。”
值得注意的是,OpenAI首席执行官Sam Altman也是这些等待多年的预订者之一,他最近尝试取消预订,并希望能退还5万美元定金,但最初未能如愿。Altman在社交平台X上发布了“分三幕”的经历,包括预订截图、退款申请,以及邮件被退回。Altman感叹“真的很期待这辆车!也理解延期,但等了七年半确实太久了。”
马斯克随后公开回应,表示“你忘了说第四幕:问题已解决且你在24小时内收到了退款。”并称这属于Altman的“性格使然”。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)