https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持OpenAI, Claude, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持OpenAI, Claude, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
台积电董事长魏哲家确认,台积电的海外建厂计划不会因外界因素改变
台积电董事长魏哲家近日宣布,尽管面临外部风险,台积电的海外设厂策略将保持不变。公司已在美国亚利桑那州、日本熊本以及计划中的德国设立新厂。熊本工厂已正式运营并获得政府补助,而另一工厂即将开工建设。魏哲家还提到,由于人工智能芯片的强劲需求,CoWoS先进封装技术产能预计将在2025年实现翻倍,并期望在2026年达到供需平衡。
新浪科技
☘️ 关注频道 @ZaiHuaPd
📮 投稿爆料 @ZaiHuabot
via 软件新闻频道📮投稿爆料 - Telegram Channel
台积电董事长魏哲家近日宣布,尽管面临外部风险,台积电的海外设厂策略将保持不变。公司已在美国亚利桑那州、日本熊本以及计划中的德国设立新厂。熊本工厂已正式运营并获得政府补助,而另一工厂即将开工建设。魏哲家还提到,由于人工智能芯片的强劲需求,CoWoS先进封装技术产能预计将在2025年实现翻倍,并期望在2026年达到供需平衡。
新浪科技
☘️ 关注频道 @ZaiHuaPd
📮 投稿爆料 @ZaiHuabot
via 软件新闻频道📮投稿爆料 - Telegram Channel
OpenAI 发布替代 GPT-3.5 的 GPT-4o mini
2024-07-19 17:59 by 图书馆员与黄金锅
OpenAI 发布了 GPT-4o 模型的小型版本 GPT-4o mini,它将取代 GPT-3.5 Turbo 提供给所有 ChatGPT 用户,包括免费和付费用户。GPT-4o mini 类似 GPT-4o,支持多模,能解释图像、文本和音频,能生成图像。GPT-4o mini 支持 128K 上下文令牌,其数据截至 2023 年 10 月,它的 API 费用比 GPT-3.5 Turbo 低 60%,每百万输入令牌 15 美分,每百万输出令牌 60 美分。GPT-4o mini 将使用名为 instruction hierarchy 的新技术,限制了越狱。
https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/
#人工智能
via Solidot - Telegram Channel
2024-07-19 17:59 by 图书馆员与黄金锅
OpenAI 发布了 GPT-4o 模型的小型版本 GPT-4o mini,它将取代 GPT-3.5 Turbo 提供给所有 ChatGPT 用户,包括免费和付费用户。GPT-4o mini 类似 GPT-4o,支持多模,能解释图像、文本和音频,能生成图像。GPT-4o mini 支持 128K 上下文令牌,其数据截至 2023 年 10 月,它的 API 费用比 GPT-3.5 Turbo 低 60%,每百万输入令牌 15 美分,每百万输出令牌 60 美分。GPT-4o mini 将使用名为 instruction hierarchy 的新技术,限制了越狱。
https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/
#人工智能
via Solidot - Telegram Channel
中国申请了逾三万生成式 AI 专利
2024-07-19 15:55 by 人猿泰山之真假狮人
日经等机构的分析显示,中国正大量申请生成式 AI 相关专利。根据占世界专利申请数量 8 成的五大专利局(日本国专利厅、美国专利商标局、欧洲专利局、中国国家知识产权局、韩国知识产权局)的数据,中国的生成式 AI 相关专利申请数为 30124 项,远远超过了美国的 12530 项。中国最近几年的专利申请急剧增加。世界五大专利局的统计显示,从 2022 年的专利申请量来看,中国为 162 万项、美国为 59 万项、日本为 29 万项、韩国为 24 万项、欧洲为 19 万项。百度是中国申请生成式 AI 专利最多的公司,有 575 项,其次是腾讯的 561 项。
https://cn.nikkei.com/columnviewpoint/column/56117-2024-07-19-05-00-05.html
#人工智能
via Solidot - Telegram Channel
2024-07-19 15:55 by 人猿泰山之真假狮人
日经等机构的分析显示,中国正大量申请生成式 AI 相关专利。根据占世界专利申请数量 8 成的五大专利局(日本国专利厅、美国专利商标局、欧洲专利局、中国国家知识产权局、韩国知识产权局)的数据,中国的生成式 AI 相关专利申请数为 30124 项,远远超过了美国的 12530 项。中国最近几年的专利申请急剧增加。世界五大专利局的统计显示,从 2022 年的专利申请量来看,中国为 162 万项、美国为 59 万项、日本为 29 万项、韩国为 24 万项、欧洲为 19 万项。百度是中国申请生成式 AI 专利最多的公司,有 575 项,其次是腾讯的 561 项。
https://cn.nikkei.com/columnviewpoint/column/56117-2024-07-19-05-00-05.html
#人工智能
via Solidot - Telegram Channel
谷歌、微软等公司通过云计算服务向中国客户提供受美国出口管控芯片的访问权
微软、谷歌和其他云服务提供商正在向中国提供尖端 AI 硬件的使用权,这有可能成为绕过美国禁运法规的一个变通办法。与中国有业务往来的公司内部人士透露,大型科技公司似乎正在与中国客户合作,为他们提供英伟达高端人工智能硬件,如基于 H100 和 A100 的 AI 服务器,而这些硬件被美国法律禁止出口到中国。
尽管美国对此有所限制,中国仍能通过“合法”变通使用英伟达尖端 AI 硬件,向对手国家“出租 AI 硬件”并不违反美国法规。尽管英伟达的 AI 硬件出口受限,但腾讯、阿里巴巴等中国科技巨头仍然可以获得计算能力,只是需要支付额外的“租金溢价”。拜登政府尚未就是否允许这些业务做出裁决,但云服务提供商相信这样的业务符合美国的法律。
—— The Information
via 风向旗参考快讯 - Telegram Channel
微软、谷歌和其他云服务提供商正在向中国提供尖端 AI 硬件的使用权,这有可能成为绕过美国禁运法规的一个变通办法。与中国有业务往来的公司内部人士透露,大型科技公司似乎正在与中国客户合作,为他们提供英伟达高端人工智能硬件,如基于 H100 和 A100 的 AI 服务器,而这些硬件被美国法律禁止出口到中国。
尽管美国对此有所限制,中国仍能通过“合法”变通使用英伟达尖端 AI 硬件,向对手国家“出租 AI 硬件”并不违反美国法规。尽管英伟达的 AI 硬件出口受限,但腾讯、阿里巴巴等中国科技巨头仍然可以获得计算能力,只是需要支付额外的“租金溢价”。拜登政府尚未就是否允许这些业务做出裁决,但云服务提供商相信这样的业务符合美国的法律。
—— The Information
via 风向旗参考快讯 - Telegram Channel
2024年7月19日,大众汽车首席执行官奥利弗·布鲁梅在北京会见了中国的工业和商务部长,讨论包括自由贸易、全球经济以及技术进步等重要议题。布鲁梅强调,在欧盟对中国制造的电动汽车(EV)提议征收关税的紧张局势下,“开放市场之间的自由和公平贸易”显得尤为重要。针对这些关税,中国已对多种商品展开调查,并敦促欧盟重新考虑其措施。讨论还涉及自动驾驶和人工智能等技术框架。值得注意的是,德国和中国最近签署了一项声明,旨在促进汽车制造商跨境数据传输,以应对欧洲的安全担忧。
(路透社)
via 老裕泰 - Telegram Channel
Some users experiencing difficulty logging in to ChatGPT
Jul 19, 04:29 PDT
Investigating - We are aware that some users are having difficulty logging in to ChatGPT. We are investigating.
via OpenAI Status - Incident History
Jul 19, 04:29 PDT
Investigating - We are aware that some users are having difficulty logging in to ChatGPT. We are investigating.
via OpenAI Status - Incident History
Yummy 😋:
OpenAI 已官宣推出GPT-4o mini 模型 该模型至少比GPT-3.5 Turbo的价格便宜60% https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/ 🗒 标签: #OpenAI #GPT 📢 频道: @GodlyNews1 🤖 投稿: @GodlyNewsBot
GPT-4o mini 已取代 GPT-3.5
🗒 标签: #OpenAI #GPT
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
via Yummy 😋 - Telegram Channel
软件新闻频道📮投稿爆料:
OpenAI 发布 GPT-4o mini OpenAI推出其最新的AI模型“GPT-4o mini”。该模型被称为目前最具能力且成本效益最高的小型模型,并计划未来集成图像、视频和音频功能。 GPT-4o mini是GPT-4o的衍生版本。将在本周四向ChatGPT免费用户、ChatGPT Plus和团队用户开放,下周向企业用户开放。 CNBC ☘️ 关注频道 @ZaiHuaPd 📮 投稿爆料 @ZaiHuabot
ChatGPT 3.5已退役 仅剩API调用 GPT-4o mini成本下降近1倍
目前在ChatGPT应用中,GPT-3.5已经完全退役,官方宣布只剩 API调用。
此外,最新的“GPT-4o mini”比GPT-4o便宜了96%~97%,比起GPT-3.5 Turbo也要便宜60%~70%。正因如此,随着GPT-4o mini上架,GPT-3.5 Turbo的历史使命到此结束。OpenAI还表示,GPT-4o mini是首个使用其全新安全策略“指令层级”的AI模型。
OpenAI|每日经济新闻
☘️ 关注频道 @ZaiHuaPd
📮 投稿爆料 @ZaiHuabot
via 软件新闻频道📮投稿爆料 - Telegram Channel
三星和谷歌因新智能手机中集成人工智能而面临欧盟审查
今年早些时候,三星电子推出了首款人工智能手机,该手机融合了三星自主研发的人工智能 Gauss 和谷歌的 Gemini Nano。这一重大技术进步目前正在接受欧盟反垄断监管机构的审查,他们正在调查三星和谷歌之间的合作是否可能阻碍其他人工智能开发商进入市场或限制竞争。如果确认存在反竞争行为,可能会对谷歌和三星展开正式的反垄断调查。这项潜在调查凸显了欧盟致力于确保公平竞争,防止在快速发展的人工智能市场出现垄断行为。
—— Businesskorea
via 风向旗参考快讯 - Telegram Channel
今年早些时候,三星电子推出了首款人工智能手机,该手机融合了三星自主研发的人工智能 Gauss 和谷歌的 Gemini Nano。这一重大技术进步目前正在接受欧盟反垄断监管机构的审查,他们正在调查三星和谷歌之间的合作是否可能阻碍其他人工智能开发商进入市场或限制竞争。如果确认存在反竞争行为,可能会对谷歌和三星展开正式的反垄断调查。这项潜在调查凸显了欧盟致力于确保公平竞争,防止在快速发展的人工智能市场出现垄断行为。
—— Businesskorea
via 风向旗参考快讯 - Telegram Channel
芯片工厂罢工持续 三星重启与工会谈判
三星电子已同意恢复与组织罢工的工会的谈判,因为这场史无前例的劳工行动有可能延续到第三周。据三星和工会代表称,三星的高管将于周五与工会领导人会面,讨论工资谈判的框架和时间表。本月发生的一系列罢工和抗议是三星半个世纪历史上规模最大、范围最广的劳工抗议活动。三星最大的工会拥有超过3万名会员,该工会呼吁员工在一家先进的人工智能存储芯片工厂以及首尔周边的其他工厂进行罢工。在争取加薪的运动出现失去动力的迹象后,该工会改变了策略。
—— 彭博社
via 风向旗参考快讯 - Telegram Channel
三星电子已同意恢复与组织罢工的工会的谈判,因为这场史无前例的劳工行动有可能延续到第三周。据三星和工会代表称,三星的高管将于周五与工会领导人会面,讨论工资谈判的框架和时间表。本月发生的一系列罢工和抗议是三星半个世纪历史上规模最大、范围最广的劳工抗议活动。三星最大的工会拥有超过3万名会员,该工会呼吁员工在一家先进的人工智能存储芯片工厂以及首尔周边的其他工厂进行罢工。在争取加薪的运动出现失去动力的迹象后,该工会改变了策略。
—— 彭博社
via 风向旗参考快讯 - Telegram Channel
OpenAI 已与博通洽谈开发新型人工智能芯片
知情人士透露,ChatGPT 制造商 OpenAI 正在与包括博通在内的芯片设计公司讨论开发一种新的人工智能芯片。OpenAI 正在探索自行制造人工智能芯片的想法,以克服其开发 ChatGPT、GPT-4 和 DALL-E3 等人工智能模型所依赖的昂贵图形处理单元的短缺。三名参与人士表示,OpenAI 正在雇用曾参与谷歌人工智能芯片张量处理单元开发的前谷歌员工,并决定开发一款人工智能服务器芯片。OpenAI 发言人说:“OpenAI 正在与行业和政府利益相关者进行持续对话,讨论如何增加获取所需基础设施的途径,确保人工智能的益处能够被广泛获取。”
—— Theinformation
via 风向旗参考快讯 - Telegram Channel
知情人士透露,ChatGPT 制造商 OpenAI 正在与包括博通在内的芯片设计公司讨论开发一种新的人工智能芯片。OpenAI 正在探索自行制造人工智能芯片的想法,以克服其开发 ChatGPT、GPT-4 和 DALL-E3 等人工智能模型所依赖的昂贵图形处理单元的短缺。三名参与人士表示,OpenAI 正在雇用曾参与谷歌人工智能芯片张量处理单元开发的前谷歌员工,并决定开发一款人工智能服务器芯片。OpenAI 发言人说:“OpenAI 正在与行业和政府利益相关者进行持续对话,讨论如何增加获取所需基础设施的途径,确保人工智能的益处能够被广泛获取。”
—— Theinformation
via 风向旗参考快讯 - Telegram Channel
Meta 停止在巴西训练其生成式 AI 工具
在巴西国家数据保护局 (ANPD) 禁止该公司使用巴西人的个人数据训练其人工智能模型后,Meta 暂停了其人工智能助手的使用。此举对 Facebook 在拥有 2 亿多人口的巴西市场开发人工智能产品的努力造成了打击。巴西政府当局在官方文件中表示,采取预防措施是由于“监护人的基本权利面临严重损害和无法弥补或难以弥补的损害的迫切风险。”此外,ANPD 还规定,如果不遵守规定,每天将处以5万雷亚尔的罚款。Meta 发言人证实了这一决定,他表示:“我们决定暂停之前在巴西上线的 genAI 功能,同时与 ANPD 接洽,解决他们有关 genAI 的问题。”
—— Techcrunch
via 风向旗参考快讯 - Telegram Channel
在巴西国家数据保护局 (ANPD) 禁止该公司使用巴西人的个人数据训练其人工智能模型后,Meta 暂停了其人工智能助手的使用。此举对 Facebook 在拥有 2 亿多人口的巴西市场开发人工智能产品的努力造成了打击。巴西政府当局在官方文件中表示,采取预防措施是由于“监护人的基本权利面临严重损害和无法弥补或难以弥补的损害的迫切风险。”此外,ANPD 还规定,如果不遵守规定,每天将处以5万雷亚尔的罚款。Meta 发言人证实了这一决定,他表示:“我们决定暂停之前在巴西上线的 genAI 功能,同时与 ANPD 接洽,解决他们有关 genAI 的问题。”
—— Techcrunch
via 风向旗参考快讯 - Telegram Channel
谷歌通过提前展示 Pixel 9 Pro 手机解决泄露问题
谷歌发布了 Pixel 9 Pro 手机的展示视频,此前有一系列泄密事件曝光了这款手机的详细信息,包括上手视频和与其他最新设备的比较。该公司计划于8月13日在加州谷歌总部举办一场活动,展示更多有关 Pixel 9 系列及其其他即将推出的设备的信息。视频中,谷歌简要展示了 Pixel 9 Pro,并透露人工智能和 Gemini 将成为该设备的重要组成部分。最近的监管文件和其他泄密事件表明,谷歌计划推出四款手机:Pixel 9、Pixel 9 Pro、Pixel 9 Pro XL 和 Pixel 9 Pro Fold。
—— Theverge、视频
via 风向旗参考快讯 - Telegram Channel
谷歌发布了 Pixel 9 Pro 手机的展示视频,此前有一系列泄密事件曝光了这款手机的详细信息,包括上手视频和与其他最新设备的比较。该公司计划于8月13日在加州谷歌总部举办一场活动,展示更多有关 Pixel 9 系列及其其他即将推出的设备的信息。视频中,谷歌简要展示了 Pixel 9 Pro,并透露人工智能和 Gemini 将成为该设备的重要组成部分。最近的监管文件和其他泄密事件表明,谷歌计划推出四款手机:Pixel 9、Pixel 9 Pro、Pixel 9 Pro XL 和 Pixel 9 Pro Fold。
—— Theverge、视频
via 风向旗参考快讯 - Telegram Channel
【OpenAI 新模型】取代 GPT-3.5 的 GPT-4o Mini 模型来咯!
太长,懒得读 (要点总结)
● 🚀 OpenAI 推出轻量、廉价的 GPT-4o Mini 模型。
● 💪 GPT-4o Mini 比 GPT-3.5 更强大,且成本更低。
● 👥 Free、Plus 和 Team 计划用户今日起可用,企业用户下周起可用。
● 🔄 GPT-3.5 将逐步从 API 下架。
● 🌐 GPT-4o Mini 支持多模态输入输出,包括文本、视觉、视频和音频。
● 📊 新模型在 MMLU 基准测试中得分 82%,优于 GPT-3.5。
● 💼 开发者已开始用 GPT-4o Mini 构建应用,如提取收据数据和自动回复功能。
● 🎯 目标是让 AI 更加经济实惠,惠及更多人。
📖 OpenAI 正在推出更便宜、更智能的模型
来源:The Verge
OpenAI 推出了名为 GPT-4o Mini 的轻量版模型,专为开发者设计。它的成本明显低于全尺寸模型,但性能比 GPT-3.5 更强大。
💰️ 费用问题
使用 OpenAI 的模型构建应用程序可能会很贵。无法承担高额费用的开发者可能会选择 Google 的 Gemini 1.5 Flash 或 Anthropic 的 Claude 3 Haiku 这样的便宜模型。现在,OpenAI 也加入了轻量模型市场的竞争。
🌍️ 使命
「我认为 GPT-4o Mini 体现了 OpenAI 让 AI 普及的使命。如果我们希望 AI 惠及全球各地、各行各业和各种应用,就必须让 AI 更加负担得起,」API 平台产品负责人 Olivier Godement 在接受《The Verge》采访时表示。
🆙 上线时间
从今天开始,Free、Plus 和 Team 计划的 ChatGPT 用户可以使用 GPT-4o Mini 代替 GPT-3.5 Turbo。企业用户将在下周获得访问权限。这意味着 ChatGPT 用户将无法再选择 GPT-3.5,但开发者如果不想切换到 GPT-4o Mini 仍可通过 API 使用 GPT-3.5。Godement 表示,GPT-3.5 将在某个时候从 API 中退休,但具体时间尚未确定。
🤖 功能与应用
新的轻量模型支持 API 中的文本和视觉功能,公司表示它很快将处理所有多模态输入和输出,如视频和音频。凭借这些功能,它看起来像是一个更强大的虚拟助手,可以理解旅行行程并提出建议。不过,这个模型主要用来处理简单任务,因此不会用来廉价地构建 Siri。
📊 性能评估
这个新模型在大规模多任务语言理解(MMLU)测试中取得了 82% 的成绩。MMLU 是一项由约 16,000 个多选题组成的基准考试,涵盖 57 个学术科目。2020 年 MMLU 首次推出时,大多数模型在其上的表现都很糟糕,因为这些模型在之前的基准考试中已经变得过于强大。GPT-3.5 在这项测试中得了 70%,GPT-4o 得了 88.7%,而 Google 声称 Gemini Ultra 创下了 90% 的历史最高分。相比之下,竞争模型 Claude 3 Haiku 和 Gemini 1.5 Flash 分别得了 75.2% 和 78.9%。
🧪 测试问题
研究人员对 MMLU 这样的基准测试持谨慎态度,因为它的实施方式因公司而异。《纽约时报》报道,这使得不同模型的分数难以比较。此外,AI 可能在其数据集中已经包含这些答案,这实际上让它可以作弊,并且通常没有第三方评估人员参与。
🔧 开发者工具
对于渴望低成本构建 AI 应用程序的开发者来说,GPT-4o Mini 是一个新的选择。OpenAI 让金融科技初创公司 Ramp 测试了该模型,使用 GPT-4o Mini 构建了一个提取收据费用数据的工具。用户可以上传收据图片,而不是在文本框中输入,模型会为他们分类。电子邮件客户端 Superhuman 也测试了 GPT-4o Mini,用它创建了自动回复建议功能。
🎯 目标
目标是为开发者提供一个轻量且廉价的工具,让他们能够创建无法负担更大、更贵模型的应用程序和工具。许多开发者会在支付高昂计算成本之前转向 Claude 3 Haiku 或 Gemini 1.5 Flash 这样的模型。
🕰️ 推出延迟
那么,OpenAI 为什么花了这么长时间才推出呢?Godement 说这是「纯粹的优先事项」,因为公司专注于创建更大更好的模型,如 GPT-4,这需要大量的「人力和计算资源」。随着时间的推移,OpenAI 注意到开发者渴望使用更小的模型,所以公司决定现在是投入资源构建 GPT-4o Mini 的时候了。
🔮 前景
18 个帖子 - 17 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Archie)
太长,懒得读 (要点总结)
● 🚀 OpenAI 推出轻量、廉价的 GPT-4o Mini 模型。
● 💪 GPT-4o Mini 比 GPT-3.5 更强大,且成本更低。
● 👥 Free、Plus 和 Team 计划用户今日起可用,企业用户下周起可用。
● 🔄 GPT-3.5 将逐步从 API 下架。
● 🌐 GPT-4o Mini 支持多模态输入输出,包括文本、视觉、视频和音频。
● 📊 新模型在 MMLU 基准测试中得分 82%,优于 GPT-3.5。
● 💼 开发者已开始用 GPT-4o Mini 构建应用,如提取收据数据和自动回复功能。
● 🎯 目标是让 AI 更加经济实惠,惠及更多人。
📖 OpenAI 正在推出更便宜、更智能的模型
来源:The Verge
OpenAI 推出了名为 GPT-4o Mini 的轻量版模型,专为开发者设计。它的成本明显低于全尺寸模型,但性能比 GPT-3.5 更强大。
💰️ 费用问题
使用 OpenAI 的模型构建应用程序可能会很贵。无法承担高额费用的开发者可能会选择 Google 的 Gemini 1.5 Flash 或 Anthropic 的 Claude 3 Haiku 这样的便宜模型。现在,OpenAI 也加入了轻量模型市场的竞争。
🌍️ 使命
「我认为 GPT-4o Mini 体现了 OpenAI 让 AI 普及的使命。如果我们希望 AI 惠及全球各地、各行各业和各种应用,就必须让 AI 更加负担得起,」API 平台产品负责人 Olivier Godement 在接受《The Verge》采访时表示。
🆙 上线时间
从今天开始,Free、Plus 和 Team 计划的 ChatGPT 用户可以使用 GPT-4o Mini 代替 GPT-3.5 Turbo。企业用户将在下周获得访问权限。这意味着 ChatGPT 用户将无法再选择 GPT-3.5,但开发者如果不想切换到 GPT-4o Mini 仍可通过 API 使用 GPT-3.5。Godement 表示,GPT-3.5 将在某个时候从 API 中退休,但具体时间尚未确定。
🤖 功能与应用
新的轻量模型支持 API 中的文本和视觉功能,公司表示它很快将处理所有多模态输入和输出,如视频和音频。凭借这些功能,它看起来像是一个更强大的虚拟助手,可以理解旅行行程并提出建议。不过,这个模型主要用来处理简单任务,因此不会用来廉价地构建 Siri。
📊 性能评估
这个新模型在大规模多任务语言理解(MMLU)测试中取得了 82% 的成绩。MMLU 是一项由约 16,000 个多选题组成的基准考试,涵盖 57 个学术科目。2020 年 MMLU 首次推出时,大多数模型在其上的表现都很糟糕,因为这些模型在之前的基准考试中已经变得过于强大。GPT-3.5 在这项测试中得了 70%,GPT-4o 得了 88.7%,而 Google 声称 Gemini Ultra 创下了 90% 的历史最高分。相比之下,竞争模型 Claude 3 Haiku 和 Gemini 1.5 Flash 分别得了 75.2% 和 78.9%。
🧪 测试问题
研究人员对 MMLU 这样的基准测试持谨慎态度,因为它的实施方式因公司而异。《纽约时报》报道,这使得不同模型的分数难以比较。此外,AI 可能在其数据集中已经包含这些答案,这实际上让它可以作弊,并且通常没有第三方评估人员参与。
🔧 开发者工具
对于渴望低成本构建 AI 应用程序的开发者来说,GPT-4o Mini 是一个新的选择。OpenAI 让金融科技初创公司 Ramp 测试了该模型,使用 GPT-4o Mini 构建了一个提取收据费用数据的工具。用户可以上传收据图片,而不是在文本框中输入,模型会为他们分类。电子邮件客户端 Superhuman 也测试了 GPT-4o Mini,用它创建了自动回复建议功能。
🎯 目标
目标是为开发者提供一个轻量且廉价的工具,让他们能够创建无法负担更大、更贵模型的应用程序和工具。许多开发者会在支付高昂计算成本之前转向 Claude 3 Haiku 或 Gemini 1.5 Flash 这样的模型。
🕰️ 推出延迟
那么,OpenAI 为什么花了这么长时间才推出呢?Godement 说这是「纯粹的优先事项」,因为公司专注于创建更大更好的模型,如 GPT-4,这需要大量的「人力和计算资源」。随着时间的推移,OpenAI 注意到开发者渴望使用更小的模型,所以公司决定现在是投入资源构建 GPT-4o Mini 的时候了。
🔮 前景
我认为它会非常受欢迎,既有使用 OpenAI 所有 AI 的现有应用,也有许多之前被定价阻挡的应用。– Godement 评价道。
18 个帖子 - 17 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Archie)