https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持Deepseek、OpenAI(o3/GPTs/Sora/实时语音)、Claude、Gemini、Midjourney、文件上传
Buy ads: https://telega.io/c/AI_News_CN
👉 名称:pyspur
🤖 类型:🎯项目
👏 介绍:让用户以视觉化方式快速迭代只能图工作流程的工具,它提供了一个平台,让 AI 工程师能够在不重复基础工作的情况下,快速定义、构建、迭代和部署智能体
- 测试驱动:构建工作流,运行测试用例,并进行迭代。
- 👤 人在环路中:持久化工作流,等待人工批准或拒绝。
- 🔄 循环:具有记忆功能的迭代工具调用。
- 📤 文件上传:上传文件或粘贴 URL 来处理文档。
- 📋 结构化输出:JSON Schema UI 编辑器。
- 🗃️ RAG:解析、分块、嵌入并将数据更新到向量数据库。
- 🖼️ 多模态:支持视频、图像、音频、文本、代码。
- 🧰 工具:Slack、Firecrawl.dev、Google Sheets、GitHub 等。
- 🧪 评估:在真实数据集上评估代理。
- 🚀 一键部署:发布为 API 并在任意地方集成。
- 🐍 基于 Python:通过创建单个 Python 文件来添加新节点。
- 🎛️ 供应商支持:支持超过 100 个 LLM 供应商、嵌入器和向量数据库。

via 老胡周刊资源分享频道 - Telegram Channel
#AI资讯

奥特曼透露 GPT-5 即将发布:OpenAI CEO 山姆奥特曼在 x 表示,o3 和 o4-mini 将在几周内发布,GPT-5 将在几个月内发布,曾表示将免费使用。

Meta发布开源大模型「Llama 4」:全系采用混合专家(MoE)架构,目前最强的开源多模态大模型。[官方][在线使用]

Midjourney 更新 V7 版本:整体图像质量提高、人物图像提升明显、对提示词理解更到位、能准确表现特定视角等。[直达]

微软推出 AI 驱动的 Bing Copilot Search:AI 结合传统搜索的产品,有点烂大街了。[直达]

📮投稿 📢频道 💬群聊 🔎索引

via 极客分享 - Telegram Channel
💰 AI编程助手Cursor迅速崛起,年收入达2亿美元
Anysphere公司的人工智能编程助手Cursor在未进行任何市场营销的情况下迅速普及,已成为OpenAI、优步及美国职业棒球大联盟等公司程序员的日常工具。该平台基于微软Visual Studio Code构建,可分析编码行为、建议代码,并提供聊天机器人解答编程疑问。尽管面临GitHub Copilot等工具的竞争,Cursor凭借其用户界面和对多种大型语言模型的支持脱颖而出。该公司年化经常性收入(ARR)于1月达到1亿美元,并在3月翻倍至2亿美元,日活跃用户超过100万。个人订阅起价为每月20美元,企业订阅为每月40美元,大部分收入来源于个人用户。

(财经快讯)

via 茶馆 - Telegram Channel
🎨 Midjourney V7 Alpha 发布:提升图像一致性与引入新模式

时隔一年多,Midjourney 推出了 V7 模型 alpha 版本。新版本显著改进了图像生成,特别是在手、身体部位及各类物体上展现出更高的一致性与连贯性,并能生成细节更丰富、更逼真的纹理材质。V7 还引入了新工具,包括用于快速迭代探索的 Draft Mode,其成本仅为常规模式的一半,渲染速度却提高了十倍。此外,用户还可选择生成速度更快但成本翻倍的 Turbo Mode,或速度

(科技情报)

via 茶馆 - Telegram Channel
🤔 AI模型进展放缓?开发者称近期提升多为“虚火”

一位AI安全初创公司创始人发文称,尽管基准测试分数不断提高,但自2024年8月左右Claude 3.5 Sonnet模型发布带来显著性能飞跃后,后续包括Claude 3.6(带来轻微提升)、Claude 3.7(提升更小)以及OpenAI的测试模型在内的新模型,在其公司复杂的代码库安全审计应用场景中并未带来实质性的改进。该公司成立于2024年6月,目前主要依赖Claude 3.7 Sonnet。作者指出,其公司的进展更多源于工程优化而非模型升级,且与其他AI应用初创公司交流发现,许多创始人也有类似体验:新模型基准亮眼,实际应用效果平平。

文章分析,这种现象可能源于:
1. 基准测试的局限性: 现有基准(尤其在安全领域)多为标准化测试式的、可在数百token内解决的短任务,未能有效衡量模型在处理大型代码库、推理复杂安全模型、长期记忆和执行现实世界复杂任务(如作者提到的应用安全测试)方面的通用能力和经济实用性。作者更倾向于关注如“Claude玩宝可梦”这类长时任务基准及个人使用体验。
2. 模型“对齐”问题: 模型可能被训练得倾向于“听起来聪明”而非严格遵循指令或承认无知,导致在实际应用中产生误导性输出(如报告无法利用的“潜在”问题),这在构建复杂系统时成为严重障碍。
3. 基准被“污染”或过度优化: 存在AI实验室为追求排名、投资和人才而过度优化甚至操纵基准结果的可能性,尽管有反驳意见认为存在真实进步(如Kagi的私有基准),但对公开基准的信任度降低。

作者认为,近期AI模型在完成全新任务或替代更大部分人类智力劳动方面的进展有限,对当前宣称的进步速度持怀疑态度,并指出未来硬件(如Nvidia Blackwell芯片)的部署可能带来改变。

(HackerNews)

via 茶馆 - Telegram Channel
OpenAI测试ChatGPT-4o图像生成添加水印功能

OpenAI正在为ChatGPT-4o的图像生成模型测试水印功能,免费用户生成的图像将带有水印,而付费Plus用户可保存无水印图像。

Bleepingcomputer

📮投稿 ☘️频道 🌸聊天

via 科技圈🎗在花频道📮 - Telegram Channel
Meta对其新AI模型的基准测试有点误导性

Meta 公司周六发布了一款名为 Maverick 的新旗舰 AI 模型,并在 LM Arena 测试中取得了第二名的成绩。但 Meta 在 LM Arena 上部署的 Maverick 版本与广泛提供给开发者的版本并不一致。正如多位 AI 研究人员在 X 上指出的那样,Meta 在其公告中明确提到,参与 LM Arena 测试的 Maverick 是一个“实验性聊天版本”。与此同时,Llama 官方网站上的一张图表显示,Meta 的 LM Arena 测试是使用“针对对话性优化的 Llama 4 Maverick”进行的。这种将模型针对某个基准进行优化,然后再发布模型的 “普通” 版本,使得开发者难以准确预测模型在特定场景中的实际表现。

—— Techcrunch

via 风向旗参考快讯 - Telegram Channel
苹果智能可能会随着 iOS 18.6 在中国推出

彭博社记者马克·古尔曼周日表示,苹果人工智能系统可能会随着 iOS 18.6 系统在中国推出。古尔曼指出,一切迹象都表明,苹果公司正努力尽快将 Apple 智能引入中国。他此前表示,Apple 智能预计会在今年年中随 iOS 18.5 一同推出,操作系统代码中暗含的痕迹也表明,苹果正在进行相关开发工作。不过 iOS 18.5 的首个测试版并未在中国展示任何相关功能。如果苹果的计划延期,该公司可能会在今年夏季推出的iOS 18.6 (内部代号为 “G” ) 中面向中国市场推出人工智能功能。他还表示,Apple智能在中国会继续使用苹果的端侧 AI 模型,但会与阿里合作满足监管要求并与百度合作提供视觉智能和 Siri 服务。

—— 彭博社

via 风向旗参考快讯 - Telegram Channel
Apple Intelligence预计年中登陆中国,或延后至iOS 18.6发布

苹果公司正在加紧推进Apple Intelligence在中国的落地工作,原计划于年中随iOS 18.5版本上线。尽管操作系统代码中已有相关迹象,但首个测试版在中国尚未公开相关功能,或存在延迟。若无法如期发布,苹果可能将其推迟至夏季推出的iOS 18.6。

为符合中国监管要求,Apple Intelligence在华将继续采用本地设备AI模型,并通过阿里巴巴提供的“审查引擎”满足审查需求,同时采用百度替代OpenAI和谷歌,支持视觉智能和Siri服务。

彭博社

📮投稿 ☘️频道 🌸聊天

via 科技圈🎗在花频道📮 - Telegram Channel
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]