ChatGPT / AI新闻聚合

https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
✨BEST AI中转 https://api.oaibest.com 2.8折起支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN

几秒前

ChatGPT首个“广告金主”：过程“很不AI” 数据都不给

via cnBeta.COM - 中文业界资讯站 (author: 稿源：华尔街见闻)

Telegraph

ChatGPT首个“广告金主”：过程“很不AI” 数据都不给

OpenAI的ChatGPT广告试点正遭遇尴尬开局——首批广告主表示，投放过程技术含量较低，而且他们没有收到太多数据来证明广告效果。据《The Information》报道，两家服务早期ChatGPT广告主的代理公司高管表示，无法证明广告为客户带来了任何可衡量的商业成果。随着OpenAI计划下月开放更多广告销售，这一早期反馈为其广告业务前景增添了不确定性。对OpenAI及其投资者而言，广告业务事关重大。截至今年2月底，ChatGPT周活跃用户约9.2亿，但截至去年7月仅约5%为付费用户。OpenAI今…

9 分钟前

年轻人兴起“社交外包”：利用 AI 处理分手、拒绝等棘手社交场合

越来越多的年轻人正将 AI 聊天机器人作为“社交拐杖”，用于处理拒绝表白或分手等棘手的人际沟通。这种现象被研究人员称为“社交外包”（Social Offloading），即通过外部代理来减轻自身的社交认知负担。近期有案例显示，一名耶鲁大学学生因缺乏处理敏感对话的经验，使用 ChatGPT 撰写了长达六段的拒绝信，虽然因措辞过于客套被对方识破，但他表示此举是为了避免表达时的犹豫不决。

专家指出，这种趋势意味着沟通行为本身正在被“外包”。非营利组织 Common Sense Media 的研究负责人 Michael Robb 认为，过度依赖 AI 介入复杂对话，可能会让年轻人产生“自己的直觉和语言永远不够好”的错觉，长期以往将削弱其独立应对社交挑战的能力，对人类的心理发育和社交技能产生负面影响。

Futurism

🌸 在花频道｜茶馆讨论｜投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel

25 分钟前

Cursor套壳、黄仁勋坐上宾 DeepSeek的光环现在都是Kimi的了

via cnBeta.COM - 中文业界资讯站 (author: 稿源：硅星人)

Telegraph

Cursor套壳、黄仁勋坐上宾 DeepSeek的光环现在都是Kimi的了

3月20日，AI编程工具Cursor发布了自研模型Composer 2，宣称是公司首次对基座模型进行“继续预训练结合强化学习”的成果。发布博客里没提基座模型的来源，措辞像是在说，这是Cursor自己从头炼出来的。不到两小时，一个名叫Fynn的开发者在调试Cursor的API时，截获了Composer 2的真实模型ID，kimi-k2p5-rl-0317-s515-fast。拆开来看，kimi-k2p5指向Kimi K2.5，rl是强化学习（Reinforcement Learning），后面是日期和版本号。…

25 分钟前

NVIDIA发明新技术KVTC 内存使用量缩减20倍

NVIDIA研究人员推出一项全新技术KVTC（KV快取转换编码），能把大型语言模型（LLM）追踪对话历史的内存用量，最高缩减20倍，而且不用修改模型本身。这一突破有望解决大型语言模型长对话推理时的内存不够用问题，大大降低企业使用AI的硬件成本，同时还能把模型首次生成回应的时间，最高提速8倍。

简单来说，KVTC技术的核心就是压缩大型语言模型背后的KV缓存——它相当于AI模型的“短期记忆”。我们可以把KV缓存理解成学生记笔记：模型处理对话时，会把关键信息（也就是Key和Value）记下来，下次生成回应时，不用从头重新计算整段对话，响应速度就能大幅提升。

但问题是，对话越长，这份“笔记”就越大，甚至会膨胀到几个GB，占用大量GPU内存，反而拖慢模型运行、限制其处理能力。

NVIDIA资深深度学习工程师Adrian Lancucki表示：“大型语言模型进行推论时，性能瓶颈往往不在运算能力，而在GPU内存。”那些暂时不用的KV缓存，会一直占用宝贵的GPU资源，逼得系统只能把它们转移到CPU内存或硬盘里，这样不仅会增加数据传输的负担，还可能出现新的卡顿问题，这些额外成本最终也会体现在企业的使用费用中。

和现有压缩技术相比，KVTC没有那些明显的局限，它借鉴了我们熟悉的JPEG图片压缩思路，通过“主成分分析、自适应量化、熵编码”三个简单步骤，就能实现高效压缩。

更方便的是，这项技术不用改动模型的核心设置和代码，属于“非侵入式”设计，企业拿来就能快速部署。它的核心优势是，能抓住KV缓存“数据高度相关”的特点，在保留关键信息的同时，去掉冗余数据，而且解压时可以分块、逐层进行，不会影响模型实时回应。

多轮测试显示，KVTC的表现远超现有主流方法。在参数量从15亿到700亿的多种模型（包括Llama 3系列、R1-Qwen 2.5等）上，即便将内存压缩20倍，模型准确率也几乎不受影响，损失不到1%，与未压缩时相差无几；而传统压缩方法仅压缩5倍，就会出现明显的准确率下降。

另外，在H100 GPU上处理8000个Token的提示时，不使用KVTC需要3秒才能生成第一个回应，使用后仅需380毫秒，提速整整8倍。

需要注意的是，KVTC更适合长对话、多轮互动场景，比如编程助手、迭代式代理推理等，若对话较短，很难发挥其压缩价值。

目前，NVIDIA正计划将这项技术整合进Dynamo框架的KV块管理器，使其能与vLLM等主流开源推论引擎兼容。

业内人士认为，随着大型语言模型可处理的对话长度不断增加，KVTC这类标准化压缩技术，未来可能会像视频压缩一样普及，助力AI更广泛地落地应用。

via cnBeta.COM - 中文业界资讯站 (author: 稿源：快科技)

Invalid media: image

Before

After