- 项目概述
- 一,数学基础专栏
- 二,神经网络基础部件
- 三,深度学习炼丹
- 四,深度学习模型压缩
- 五,模型推理部署
- 六,异构计算
- 七,大语言模型推理及服务化
- 八,进阶课程
- 九,其他
- Star History
- 参考资料
本仓库项目是个人总结的计算机视觉和大语言模型学习笔记,包含深度学习基础知识、神经网络基础部件详解、深度学习炼丹策略、深度学习模型压缩算法、深度学习推理框架代码解析及动手实战,以及 LLM
基础及推理优化的专栏笔记。
1,神经网络基础部件:
2,深度学习基础:
1,模型部署:
2,模型推理:
3,ncnn
框架源码解析:
5,AI/NPU/GPU 芯片特性:
- 移动端异构计算:
neon
编程 - GPU 端异构计算:
cuda
编程
通用矩阵乘法 gemm
算法解析与优化、neon
、cuda
编程等内容,以及 ncnn
框架代码解析总结。
1,LLM 基础知识:
2,Transformer 模型基础:
3,大规模模型的推理优化及部署总结:
4,DeepSpeed 框架学习笔记:
1,推荐几个比较好的深度学习模型压缩与加速的仓库和课程资料:
- 神经网络基本原理教程
- AI-System: 深度学习系统,主要从底层方向讲解深度学习系统等原理、加速方法、矩阵成乘加计算等。
- pytorch-deep-learning:很好的 pytorch 深度学习教程。
2,一些笔记好的博客链接:
- The Illustrated Transformer: 国内比较好的博客大都参考这篇文章。
- C++ 并发编程(从C++11到C++17): 不错的 C++ 并发编程教程。
- What are Diffusion Models?
- annotated_deep_learning_paper_implementations
最后,持续高质量创作不易,有 5
秒空闲时间的,可以扫码关注我的公众号-嵌入式视觉,记录 CV 算法工程师成长之路,分享技术总结、读书笔记和个人感悟。
公众号不会写标题党文章,也不输出给大家带来的焦虑的内容!
- 《深度学习》
- 《机器学习》
- 《动手学深度学习》
- 《机器学习系统:设计和实现》
- 《AI-EDU》
- 《AI-System》
- 《PyTorch_tutorial_0.0.5_余霆嵩》
- 《动手编写深度学习推理框架 Planer》
- distill:知识精要和在线可视化
- LLVM IR入门指南
- nanoPyC