👉 名称:harleyszhang/llm_note
🤖 类型:👀资料
👏 介绍:一个关于大型语言模型(LLM)的笔记仓库,涵盖了模型推理、Transformer 模型结构、LLM 框架代码分析以及高性能计算等内容
- Transformer 模型系列:详细解读了 Transformer 模型的论文,实现代码,以及不同版本的 GPT 和 LLaMA 模型结构。
- LLM 性能分析:分析了模型的参数量、计算量、显存占用以及推理延迟。
- LLM 压缩技术:介绍了 SmoothQuant 和 AWQ 等模型压缩算法。
- LLM 推理与部署:讨论了推理服务框架的技术总结和源码解析,包括 DeepSpeed 框架的学习笔记,以及推理优化、系统优化方法和可视化工具。
- 高性能计算:提供了关于 Triton 和 CUDA 的编程笔记,以及高性能计算编程的学习资料推荐。

via 老胡周刊资源分享频道 - Telegram Channel
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]