Skip to content

Commit

Permalink
init
Browse files Browse the repository at this point in the history
  • Loading branch information
BBuf committed Apr 20, 2023
1 parent e673c00 commit 6c0a394
Showing 1 changed file with 55 additions and 1 deletion.
56 changes: 55 additions & 1 deletion README.md
Original file line number Diff line number Diff line change
Expand Up @@ -8,9 +8,27 @@
- [PyTorch的hook及其在Grad-CAM中的应用](https://zhuanlan.zhihu.com/p/75894080)
- [ML System 领域分享第一季](https://zhuanlan.zhihu.com/p/562418633)
- [ML System 领域分享第二季](https://zhuanlan.zhihu.com/p/567009250)
- [PyTorch中的contiguous](https://zhuanlan.zhihu.com/p/64551412)
- [一文理解 PyTorch 中的 SyncBatchNorm](https://zhuanlan.zhihu.com/p/555881100)
- [一文读懂 Pytorch 中的 Tensor View 机制](https://zhuanlan.zhihu.com/p/463664495)
- [一文学会 Pytorch 中的 einsum](https://zhuanlan.zhihu.com/p/361209187)
- [PyTorch 源码解读之 torch.autograd:梯度计算详解](https://zhuanlan.zhihu.com/p/321449610)
- [PyTorch 源码解读之 BN & SyncBN:BN 与 多卡同步 BN 详解](https://zhuanlan.zhihu.com/p/337732517)
- [PyTorch 源码解读之 torch.utils.data:解析数据处理全流程](https://zhuanlan.zhihu.com/p/337850513)
- [PyTorch 源码解读之 nn.Module:核心网络模块接口详解](https://zhuanlan.zhihu.com/p/340453841)
- [PyTorch 源码解读之 DP & DDP:模型并行和分布式训练解析](https://zhuanlan.zhihu.com/p/343951042)
- [PyTorch 源码解读之 torch.optim:优化算法接口详解](https://zhuanlan.zhihu.com/p/346205754)
- [PyTorch 源码解读之 torch.cuda.amp: 自动混合精度详解](https://zhuanlan.zhihu.com/p/348554267)
- [PyTorch 源码解读之 cpp_extension:揭秘 C++/CUDA 算子实现和调用全流程](https://zhuanlan.zhihu.com/p/348555597)
- [TorchScript 解读(一):初识 TorchScript](https://zhuanlan.zhihu.com/p/486914187)
- [TorchScript 解读(二):Torch jit tracer 实现解析](https://zhuanlan.zhihu.com/p/489090393)
- [TorchScript 解读(三):jit 中的 subgraph rewriter](https://zhuanlan.zhihu.com/p/493955209)
- [TorchScript 解读(四):Torch jit 中的别名分析](https://zhuanlan.zhihu.com/p/530242380)
- [[可能99%人犯的PyTorch错误] set_seed 会破坏随机性,官方 worker_init_fn 无法解决](https://zhuanlan.zhihu.com/p/618639620)

### OneFlow

- [成城 OneFlow —— 让每一位算法工程师都有能力训练 GPT](https://zhuanlan.zhihu.com/p/371499074)
- [大缺弦 Oneflow 基于重计算的动态图显存优化实践](https://mp.weixin.qq.com/s/1oBszAsvrAdPVNKD2SgCFA)
- [黄卓彬 在 Oneflow 中开发 Gather Primitive](https://zobinhuang.github.io/sec_learning/Tech_System_And_Network/Oneflow_Gather_Primitive_Development/index.html)
- [黄卓彬 在 Oneflow 中开发算子的基本流程 ](https://zobinhuang.github.io/sec_learning/Tech_System_And_Network/Oneflow_Operator_Development/index.html)
Expand All @@ -24,4 +42,40 @@
- [郑泽凯 OneFlow: 从 Job 到 Plan](https://www.cnblogs.com/zzk0/p/15222259.html)
- [郑泽凯 OneFlow: 启动 Runtime](https://www.cnblogs.com/zzk0/p/15226851.html)
- [郑泽凯 OneFlow: 计算数据的来源](https://www.cnblogs.com/zzk0/p/15230583.html)
- oneflow专栏 待统计
- [成城 OneFlow是如何做到世界最快深度学习框架的](https://zhuanlan.zhihu.com/p/271740706)
- [成城 仅此一文让您掌握OneFlow框架的系统设计(上篇)](https://zhuanlan.zhihu.com/p/337851255)
- [成城 仅此一文让您掌握OneFlow框架的系统设计(中篇)](https://zhuanlan.zhihu.com/p/338699487)
- [成城 仅此一文让您掌握OneFlow框架的系统设计(下篇)](https://zhuanlan.zhihu.com/p/339208452)
- [郭冉 如何实现一个高效的Softmax CUDA kernel?——OneFlow 性能优化分享](https://zhuanlan.zhihu.com/p/341059988)
- [赵露阳 一个Job在OneFlow中的执行过程—上篇](https://zhuanlan.zhihu.com/p/344531540)
- [赵露阳 一个Job在OneFlow中的执行过程—中篇](https://zhuanlan.zhihu.com/p/355654002)
- [赵露阳 一个Job在OneFlow中的执行过程—下篇](https://zhuanlan.zhihu.com/p/363689736)
- [赵露阳 亚线性内存优化—activation checkpointing在oneflow中的实现](https://zhuanlan.zhihu.com/p/373662730)
- [梁德澎 Oneflow 框架添加算子实践 ---- expand 和 repeat](https://zhuanlan.zhihu.com/p/417488020)
- [郑泽康 在OneFlow实现Unfold Fold算子](https://zhuanlan.zhihu.com/p/418191393)
- [郑泽康 在OneFlow实现数据类型自动提升](https://zhuanlan.zhihu.com/p/418191937)
- [赵露阳 OneFlow中的dataloader原理及实现(对齐pytorch)](https://zhuanlan.zhihu.com/p/419755080)
- [OneFlow中的错误处理:Maybe](https://zhuanlan.zhihu.com/p/423811115)
- [郑泽康 如何实现比PyTorch快6倍的Permute/Transpose算子?](https://zhuanlan.zhihu.com/p/425587014)
- [柳俊丞 如何设置CUDA Kernel中的grid_size和block_size?](https://zhuanlan.zhihu.com/p/442304996)
- [郭冉 CUDA优化之LayerNorm性能优化实践](https://zhuanlan.zhihu.com/p/443026261)
- [高效、易用、可拓展我全都要:OneFlow CUDA Elementwise 模板库的设计优化思路](https://zhuanlan.zhihu.com/p/447577193)
- [BBuf 深度学习框架如何优雅的做算子对齐任务?](https://zhuanlan.zhihu.com/p/458111952)
- [BBuf 一个Tensor在深度学习框架中的执行过程简单梳理](https://zhuanlan.zhihu.com/p/462562942)
- [月踏 从Python到C++调用过程分析|OneFlow学习笔记](https://zhuanlan.zhihu.com/p/497651763)
- [月踏 Global View的概念和实现|OneFlow学习笔记](https://zhuanlan.zhihu.com/p/498962713)
- [月踏 OneFlow学习笔记:从Functor到OpExprInterpreter](https://zhuanlan.zhihu.com/p/463628599)
- [月踏 OneFlow学习笔记:从OpExprInterpreter到OpKernel](https://zhuanlan.zhihu.com/p/507471077)
- [月踏 Autograd解析|OneFlow学习笔记](https://zhuanlan.zhihu.com/p/514080516)
- [郑泽康 CUDA优化之PReLU性能调优](https://zhuanlan.zhihu.com/p/515926074)
- [赵露阳【oneflow】算子在深度学习框架中的执行及interpreter](https://zhuanlan.zhihu.com/p/523884650)
- [许啸宇 一种分布式深度学习编程新范式:Global Tensor](https://zhuanlan.zhihu.com/p/543441584)
- [郑建华 OneFlow源码解析(1):算子签名的自动推断](https://zhuanlan.zhihu.com/p/535109926)
- [郑建华 OneFlow源码解析:Op、Kernel与解释器](https://zhuanlan.zhihu.com/p/548404516)
- [郑建华 OneFlow源码解析:算子指令在虚拟机中的执行](https://zhuanlan.zhihu.com/p/551766125)
- [一块GPU训练TB级推荐模型不是梦,OneEmbedding性能一骑绝尘](https://zhuanlan.zhihu.com/p/552943580)
- [郑建华 OneFlow源码解析:Tensor类型体系与Local Tensor](https://zhuanlan.zhihu.com/p/560424453)
- [郑建华 OneFlow源码解析:Global Tensor](https://zhuanlan.zhihu.com/p/577716422)
- [郑建华 OneFlow源码解析:自动微分机制](https://zhuanlan.zhihu.com/p/587951710)
- [刘耀辉 适配PyTorch FX,OneFlow让量化感知训练更简单](https://zhuanlan.zhihu.com/p/611910798)
- [郑建华 OneFlow源码解析:Eager模式下的设备管理与并发执行](https://zhuanlan.zhihu.com/p/617870143)

0 comments on commit 6c0a394

Please sign in to comment.