DeepSeek开源周第一天榨干显卡性能 网友怒赞是真正的Open AI

实际上,作为DeepSeek开源的第一个项目:FlashMLA,可以理解为专门为高性能显卡(Hopper GPU)设计的“AI加速工具”。它的核心功能是让AI模型在处理长度不固定的数据时更高效。例如,当AI同时处理长句子和短句子时,FlashMLA能动态调整资源分配,避免浪费算力。据媒体报道,目前有网友实测显示,它在处理速度和计算效率上接近H800显卡的理论极限(内存速度达每秒3000GB,算力达580万亿次/秒)。这意味着未来AI应用(如实时翻译、内容生成)可能更快、更省成本。开发者现已可免费使用这一代码优化自己的AI项目。网友们纷纷点赞,向DeepSeek工程团队致以崇高的敬意,有些网友甚至不敢相信工程团队公布的数据,但很快有人用上了,并且贴出实测数据。有人对此表示,“DeepSeek王炸开局,FlashMLA是真正能加速AGI进程的。”有人称赞说,“DeepSeek是真正的Open AI。” ...

PC版:https://www.cnbeta.com.tw/articles/soft/1481168.htm
手机版:https://m.cnbeta.com.tw/view/1481168.htm
cnBeta.COM
DeepSeek开源周第一天榨干显卡性能 网友怒赞是真正的Open AI - AI 人工智能 - cnBeta.COM

今日,DeepSeek正式启动开源周,首个开源的代码库为FlashMLA。据了解,这是一个针对HopperGPU优化的高效MLA解码内核,专为处理可变长度序列而设计,目前已投入实际生产应用。另外,与传统解码器相比,FlashMLA具有在处理可变长度序列时,能够显著提高计算效率和速度的特点。


via cnBeta.COM中文业界资讯站 - Telegram Channel
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]