🚀 Claude Sonnet 4 上线百万级上下文,处理能力实现五倍飞跃
Anthropic 宣布其 Claude Sonnet 4 模型现已支持高达 100 万个 token 的上下文窗口,相较此前提升了 5 倍。这一重大升级使得模型能够在一个请求中处理超过 75,000 行代码的整个代码库或数十篇研究论文。
该长上下文支持功能已在 Anthropic API 和 Amazon Bedrock 上线公开测试版,并将很快登陆 Google Cloud 的 Vertex AI。更长的上下文能力将赋能开发者进行大规模代码分析、文档综合处理以及构建更具上下文感知能力的智能代理。
为应对计算需求增加,当提示词(prompt)超过 20 万个 token 时,定价将进行调整:输入价格从每百万 token 3 美元增至 6 美元,输出价格从 15 美元增至 22.5 美元。同时,结合提示词缓存和批量处理,用户可进一步降低成本,其中批量处理可额外节省 50% 的费用。
客户如 Bolt.new 和 iGent AI 均表示,百万级上下文窗口显著提升了其代码生成工作流和软件工程代理(如 Maestro)的性能和处理规模,实现了在真实代码库上进行多日会话的可能。
(HackerNews)
via 茶馆 - Telegram Channel
Anthropic 宣布其 Claude Sonnet 4 模型现已支持高达 100 万个 token 的上下文窗口,相较此前提升了 5 倍。这一重大升级使得模型能够在一个请求中处理超过 75,000 行代码的整个代码库或数十篇研究论文。
该长上下文支持功能已在 Anthropic API 和 Amazon Bedrock 上线公开测试版,并将很快登陆 Google Cloud 的 Vertex AI。更长的上下文能力将赋能开发者进行大规模代码分析、文档综合处理以及构建更具上下文感知能力的智能代理。
为应对计算需求增加,当提示词(prompt)超过 20 万个 token 时,定价将进行调整:输入价格从每百万 token 3 美元增至 6 美元,输出价格从 15 美元增至 22.5 美元。同时,结合提示词缓存和批量处理,用户可进一步降低成本,其中批量处理可额外节省 50% 的费用。
客户如 Bolt.new 和 iGent AI 均表示,百万级上下文窗口显著提升了其代码生成工作流和软件工程代理(如 Maestro)的性能和处理规模,实现了在真实代码库上进行多日会话的可能。
(HackerNews)
via 茶馆 - Telegram Channel