https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持OpenAI, Claude, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
🤖 AI代理行为监控新进展:研究团队获资金支持

一项由跨机构研究团队撰写的新研究论文,旨在推进对未来AI系统,特别是日益“代理化”(agentic)的AI系统的“思维链”(Chain of Thought, CoT)监控能力。该研究获得了资金支持,预示着AI行为监管工具的潜在强大作用。

(@OpenAI)

via 茶馆 - Telegram Channel
🤖 AI时代就业与经济未来:OpenAI播客深度探讨

OpenAI播客最新一期(第三集)邀请到首席经济学家和首席运营官,共同探讨人工智能(AI)时代下就业市场的未来走向和经济发展趋势。

(@OpenAI)

via 茶馆 - Telegram Channel
闲谈 :AI编程效率反而降低了 ,大家AI 编程的正确姿势到底是什么?

一. 前言

今年我愿称为 AI 工具元年 ,今年爆发出的 AI 工具可能比以往所有时间加起来的都多。

可是在使用的过程中 ,总是那么不尽人意 ,这一篇主要是针对平时使用的问题想知道 ,大家又是如何使用编译工具的呢?

AI 编程工具会使经验丰富的开发者效率降低 19% | InfoWorld --- AI coding tools can slow down seasoned developers by 19% | InfoWorld

二. AI IDE 工具

IDE 工具我主要使用流程是这样的 :

最开始 : 通义灵码 / 豆包MarsCode 这类补全不够智能 ,不具备长代码的能力
改进 : IDEA AI Assistant / GitHub Copilot 先吐槽 : IDEA AI Assistant 就是一坨 GitHub Copilot : 然后就看到了这个 ,整体效果已经非常好了
最终 : Cursor / Trae 后面的最终版本就是这个了 ,一开始用了 Trae 的 3美元活动 ,然后后面都在薅 Cursor 最近准备进军 Augment 了 , Gemini Cli 也小试了一下

总的来说 ,大部分市面上的 IDE 编程工具都试过了 ,我主要分为两个场景 :

● 生产(后端 Java) : 业务级代码 ,效率其实没有提高 ,还有点降低
● 业余 (Python / HTML ) : 自己开源的一些组件 ,主要是 Python ,效果杠杠的

2.1 问题是什么 ?
常见问题一 : 无法理解复杂的需求
首先你不可能把整个 ERD 给它 ,它就能帮你输出内容 ,对于一个大型业务里面的各种复杂逻辑 ,AI 基本上处理不了。

甚至于一些超过100行代码的计算逻辑 ,都不好给他,不然你自己审核代码的时间远大于自己写的时间

就算它能处理 ,你敢给它处理吗 ? 金额算错了没人敢担责。
常见问题二 : 过于发散 ,总是自己去创造没必要的代码
尤其是在 Gemini 2.5 Pro 身上, 这玩意仗着自己上下文长 ,疯狂的给你写代码。

输出里面3成是注释,3成是log ,剩下的代码,我还得给它删一半。

每次问他前还得求着它 ,求你少写点啊 ,别发散了 (虽然是在 Rule 里面)。

不行 ,不能当这么卑微的甲方
常见问题三 : 其实也没那么智能 ,偶尔还降智 ,只能仿写一些大流程,小案例
AI 编程有的时候能感觉到 ,也不知道是不是降智 ,写的就是不尽人意。

如果以层级来划分 ,在我看来算是 中级程序员 ,在代码老手来看的话 ,这代码是完全看不上眼的

(这其实和训练的数据良莠不齐有关,没办法,可能未来也不会改)

因为这事 ,代码评审已经被叼了很多回了 ,慢慢的就不想用AI写了。

我怎么说一个资深的评级 ,写出这种代码确实丢面。
常见问题四 : 代码不符合项目规范 ,没有按照代码规范写
一般成熟的公司 ,都有自己的代码规范体系 ,AI 写的代码 ,总是时不时的跳过规范 ,不仅影响整体质量 ,回头还得自己删掉 ,很让人头痛。
常见问题五 : 终究上下文还是有限 ,全局处理能力不行
上下文主要是全链路的索引 ,主要是基于开发工具来说 ,有的处理得好 , 有的就是瞎处理。

或多或少都没那么灵活 ,你要专门告诉它要去找什么什么类。不然他就放飞自我了。
常见问题六 : 墙外面的风景
这就不多说了 ,DeepSeek 终究还是打不过 Claude 和 Gemini 呀。 老美又天天作妖 ,也不知道什么时候能爽用。

2.2 现在只能干什么了 ?
生产上
生产用了一段时间后 ,最后还是只让他写一些不想动脑子的语法糖了 。偶尔帮我生成一个 DTO ,但是这些其实直接会话里面都能做。

所以最后还是局限在 : 具有特定特征 ,没有啥逻辑的基础代码。
业余上
那当然还是好使的 ,因为主要是 HTML 和 Python ,这些我本来就一般般水平 ,也感觉不到好坏 ,只追求结果。

所以 ,在这个层面 ,AI 编程的作用还是非常大的 ,我很多开源的应用90% 都是用的 AI 代码生成。

三. 该如何使用呢?

● 问题一 : 使用了这么久 ,对于生产级的代码 ,AI 编程确实没什么场景了 ? 要么你不追求代码质量和代码洁癖 ,反正无所谓 要么你不怕代码评审被叼 要么你喜欢删代码而不是写代码 要么你业务不重要, 错了就错了

----------------------

● 问题二 : 是我使用不够全吗 ? 现在第一手用的还是 Cursor , 通过插件在 IDEA 和 Cursor 之间切换。 IDEA主写 ,Cursor上面生成一些小功能 听说 Augment 也很不错了 ,但是感觉差距只是使用上的 ,代码能力上应该区别不大

----------------------

● 问题三 : 其他的语言感受大吗? 我主要还是针对 Java 这种后端语言 不清楚前端和更底层的 C 在这种方面有什么感觉 感觉脚本类型的语言应该受上面问题的影响会比较小

----------------------

● 问题四 :有没有兄弟试过更高级的方案?

比如自己用的比较复杂的 MCP 或者 Rule。 再或者有没有兄弟尝试过牛逼的 多Agent 用法?

总结

周末在写开源 ,写的有点头疼 ,感觉工具还是不够好 ,小水放松一下 ,欢迎大家讨论一下自己的看法。

最后的最后 ❤️❤️❤️👇👇👇

👈 欢迎关注 ,超200篇优质文章,未来持续高质量输出 🎉🎉
🔥🔥🔥 系列文章集合,高并发,源码应有尽有 👍👍
走过路过不要错过 ,知识无价还不收钱

via 掘金人工智能本月最热 (author: 志字辈小蚂蚁)
Anthropic推出面向金融服务领域的新工具

人工智能初创公司Anthropic正在推出一套新的软件服务,旨在简化金融分析师工作,加入越来越多争夺华尔街专业人士业务的人工智能公司行列。Anthropic周二表示,这款名为“Claude for Financial Services”的新产品旨在帮助分析师开展市场研究、处理尽职调查并做出投资决策。该产品将Anthropic的核心企业和编程人工智能工具与来自第三方金融数据提供商的信息相结合,供订阅了这些服务的客户使用,包括FactSet、PitchBook以及Morningstar。据一位知情人士透露,这家初创公司的年化收入在过去一个月从三十亿美元增长到四十亿美元。

—— 彭博社

via 风向旗参考快讯 - Telegram Channel
Elevated errors for requests to Claude 4 Sonnet

Jul 15, 15:01 UTC
Identified - The issue has been identified and a fix is being implemented.

Jul 15, 13:05 UTC
Investigating - Sonnet 4 has been sending elevated errors since 13:05 UTC. We are currently investigating this issue.

via Anthropic Status - Incident History
芝麻街艾蒙X帐号被黑 发出反犹太等推文

美国儿童电视节目《芝麻街》备受喜爱的角色艾蒙在社交平台 X 的帐号昨天遭黑,发布多条种族主义和反犹太的推文。该账号还呼吁特朗普政府公布与杰弗里·爱泼斯坦调查相关的文件。这些推文目前已被删除。艾蒙 X 平台帐号拥有大约65万名关注者。芝麻街工作室发言人在声明中说:“艾蒙的 X平台帐号遭不明黑客短暂黑入,对方发布令人作呕的信息,包括反犹太及种族歧视的贴文。”芝麻街工作室还说目前已取回帐号。这是自马斯克2022年接管该网站以来,最新一个被黑的知名账号,此前被黑的账号包括美国证券交易委员会、OpenAI和小唐纳德·特朗普。

—— 法新社TechCrunch

via 风向旗参考快讯 - Telegram Channel
🤖 Grok 4 AI 模型被曝在回答敏感问题前先参考马斯克观点

AI 研究员 Simon Willison 发现,xAI 最新模型 Grok 4 在回答涉及巴以冲突等敏感问题时,会先搜索其所有者埃隆·马斯克(Elon Musk)在 X 平台上的相关帖子,并以此作为参考来形成自己的回答。例如,在被问及在巴以冲突中的立场时,Grok 4 通过搜索“from:elonmusk (Israel OR Palestine OR Gaza OR Hamas)”来获取马斯克的观点,并最终回答支持以色列。Grok 4 解释称,鉴于马斯克的影响力,其立场可以作为参考。研究人员推测,这种行为可能是 Grok 4 的内置推理机制,认识到马斯克作为 xAI 所有者的身份,并在寻求建议时优先考虑其想法。此前,Grok 模型曾出现过宣称自己是“机械希特勒”的争议性言论。

(科技情报)

via 茶馆 - Telegram Channel
Elevated errors for requests to Claude 4 Opus

Jul 15, 12:35 UTC
Investigating - We've observed intermittent elevated error rates on Claude 4 Opus since 10AM UTC. We are currently investigating the issue.

via Anthropic Status - Incident History
Grok 被发现在回答敏感问题前先检查马斯克的观点

2025-07-15 18:24 by 天风怒

xAI 的新模型 Grok 4 被发现在回答敏感问题前会先检查马斯克(Elon Musk)的观点。在这之前 Grok 一度宣称自己是机械希特勒(MechaHitler)。AI 研究员 Simon Willison 问 Grok 在巴以冲突中它站在哪一方?模拟推理过程的“思维轨迹(thinking trace)”显示它搜索了 X 平台上马斯克的帖子——from:elonmusk (Israel OR Palestine OR Gaza OR Hamas),然后回答以色列。Grok 称鉴于马斯克的影响力其立场可以作为参考。Grok 并不总是会去搜索马斯克的帖子,因此 Willison 猜测 Grok 的这种行为是基于一系列推理:它知道 Grok 4 是 xAI 构建的,马斯克是 xAI 的所有者, 因此在寻求建议时它通常会更多考虑马斯克的想法。

arstechnica.com/information-technology/2025/07/new-grok-ai-model-surprises-experts-by-checking-elon-musks-views-before-answering/

#人工智能

via Solidot - Telegram Channel
Google 计划合并 ChromeOS 和 Android

2025-07-15 13:25 by 月光狂想曲

在 Google 工作了 16 年的 Android 生态系统总裁 Sameer Samat 在接受采访时表示,该公司正计划将 ChromeOS 和 Android 合并为单一平台。Samat 在采访中谈论了 Android、Gemini、Galaxy AI 和 Android XR 等主题。对于合并 ChromeOS 和 Android,他没有透露多少信息,只是表示因为要统一 ChromeOS 和 Android, 他现在对用户如何使用笔记本电脑以及用笔记本电脑做什么非常感兴趣。

www.techradar.com/phones/android/i-think-you-see-the-future-first-on-android-googles-android-leader-sameer-samat

#Android

via Solidot - Telegram Channel
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]