init

BBuf · Apr 20, 2023 · 6c0a394 · 6c0a394
1 parent e673c00
commit 6c0a394
Showing 1 changed file with 55 additions and 1 deletion.
diff --git a/README.md b/README.md
@@ -8,9 +8,27 @@
 - [PyTorch的hook及其在Grad-CAM中的应用](https://zhuanlan.zhihu.com/p/75894080)
 - [ML System 领域分享第一季](https://zhuanlan.zhihu.com/p/562418633)
 - [ML System 领域分享第二季](https://zhuanlan.zhihu.com/p/567009250)
+- [PyTorch中的contiguous](https://zhuanlan.zhihu.com/p/64551412)
+- [一文理解 PyTorch 中的 SyncBatchNorm](https://zhuanlan.zhihu.com/p/555881100)
+- [一文读懂 Pytorch 中的 Tensor View 机制](https://zhuanlan.zhihu.com/p/463664495)
+- [一文学会 Pytorch 中的 einsum](https://zhuanlan.zhihu.com/p/361209187)
+- [PyTorch 源码解读之 torch.autograd：梯度计算详解](https://zhuanlan.zhihu.com/p/321449610)
+- [PyTorch 源码解读之 BN & SyncBN：BN 与 多卡同步 BN 详解](https://zhuanlan.zhihu.com/p/337732517)
+- [PyTorch 源码解读之 torch.utils.data：解析数据处理全流程](https://zhuanlan.zhihu.com/p/337850513)
+- [PyTorch 源码解读之 nn.Module：核心网络模块接口详解](https://zhuanlan.zhihu.com/p/340453841)
+- [PyTorch 源码解读之 DP & DDP：模型并行和分布式训练解析](https://zhuanlan.zhihu.com/p/343951042)
+- [PyTorch 源码解读之 torch.optim：优化算法接口详解](https://zhuanlan.zhihu.com/p/346205754)
+- [PyTorch 源码解读之 torch.cuda.amp: 自动混合精度详解](https://zhuanlan.zhihu.com/p/348554267)
+- [PyTorch 源码解读之 cpp_extension：揭秘 C++/CUDA 算子实现和调用全流程](https://zhuanlan.zhihu.com/p/348555597)
+- [TorchScript 解读（一）：初识 TorchScript](https://zhuanlan.zhihu.com/p/486914187)
+- [TorchScript 解读（二）：Torch jit tracer 实现解析](https://zhuanlan.zhihu.com/p/489090393)
+- [TorchScript 解读（三）：jit 中的 subgraph rewriter](https://zhuanlan.zhihu.com/p/493955209)
+- [TorchScript 解读（四）：Torch jit 中的别名分析](https://zhuanlan.zhihu.com/p/530242380)
+- [[可能99%人犯的PyTorch错误] set_seed 会破坏随机性，官方 worker_init_fn 无法解决](https://zhuanlan.zhihu.com/p/618639620)
 
 ### OneFlow
 
+- [成城 OneFlow —— 让每一位算法工程师都有能力训练 GPT](https://zhuanlan.zhihu.com/p/371499074)
 - [大缺弦 Oneflow 基于重计算的动态图显存优化实践](https://mp.weixin.qq.com/s/1oBszAsvrAdPVNKD2SgCFA)
 - [黄卓彬 在 Oneflow 中开发 Gather Primitive](https://zobinhuang.github.io/sec_learning/Tech_System_And_Network/Oneflow_Gather_Primitive_Development/index.html)
 - [黄卓彬 在 Oneflow 中开发算子的基本流程 ](https://zobinhuang.github.io/sec_learning/Tech_System_And_Network/Oneflow_Operator_Development/index.html)
@@ -24,4 +42,40 @@
 - [郑泽凯 OneFlow: 从 Job 到 Plan](https://www.cnblogs.com/zzk0/p/15222259.html)
 - [郑泽凯 OneFlow: 启动 Runtime](https://www.cnblogs.com/zzk0/p/15226851.html)
 - [郑泽凯 OneFlow: 计算数据的来源](https://www.cnblogs.com/zzk0/p/15230583.html)
-- oneflow专栏 待统计
+- [成城 OneFlow是如何做到世界最快深度学习框架的](https://zhuanlan.zhihu.com/p/271740706)
+- [成城 仅此一文让您掌握OneFlow框架的系统设计（上篇）](https://zhuanlan.zhihu.com/p/337851255)
+- [成城 仅此一文让您掌握OneFlow框架的系统设计（中篇）](https://zhuanlan.zhihu.com/p/338699487)
+- [成城 仅此一文让您掌握OneFlow框架的系统设计（下篇）](https://zhuanlan.zhihu.com/p/339208452)
+- [郭冉 如何实现一个高效的Softmax CUDA kernel？——OneFlow 性能优化分享](https://zhuanlan.zhihu.com/p/341059988)
+- [赵露阳 一个Job在OneFlow中的执行过程—上篇](https://zhuanlan.zhihu.com/p/344531540)
+- [赵露阳 一个Job在OneFlow中的执行过程—中篇](https://zhuanlan.zhihu.com/p/355654002)
+- [赵露阳 一个Job在OneFlow中的执行过程—下篇](https://zhuanlan.zhihu.com/p/363689736)
+- [赵露阳 亚线性内存优化—activation checkpointing在oneflow中的实现](https://zhuanlan.zhihu.com/p/373662730)
+- [梁德澎 Oneflow 框架添加算子实践 ---- expand 和 repeat](https://zhuanlan.zhihu.com/p/417488020)
+- [郑泽康 在OneFlow实现Unfold Fold算子](https://zhuanlan.zhihu.com/p/418191393)
+- [郑泽康 在OneFlow实现数据类型自动提升](https://zhuanlan.zhihu.com/p/418191937)
+- [赵露阳 OneFlow中的dataloader原理及实现（对齐pytorch）](https://zhuanlan.zhihu.com/p/419755080)
+- [OneFlow中的错误处理：Maybe](https://zhuanlan.zhihu.com/p/423811115)
+- [郑泽康 如何实现比PyTorch快6倍的Permute/Transpose算子？](https://zhuanlan.zhihu.com/p/425587014)
+- [柳俊丞 如何设置CUDA Kernel中的grid_size和block_size？](https://zhuanlan.zhihu.com/p/442304996)
+- [郭冉 CUDA优化之LayerNorm性能优化实践](https://zhuanlan.zhihu.com/p/443026261)
+- [高效、易用、可拓展我全都要：OneFlow CUDA Elementwise 模板库的设计优化思路](https://zhuanlan.zhihu.com/p/447577193)
+- [BBuf 深度学习框架如何优雅的做算子对齐任务？](https://zhuanlan.zhihu.com/p/458111952)
+- [BBuf 一个Tensor在深度学习框架中的执行过程简单梳理](https://zhuanlan.zhihu.com/p/462562942)
+- [月踏 从Python到C++调用过程分析｜OneFlow学习笔记](https://zhuanlan.zhihu.com/p/497651763)
+- [月踏 Global View的概念和实现｜OneFlow学习笔记](https://zhuanlan.zhihu.com/p/498962713)
+- [月踏 OneFlow学习笔记：从Functor到OpExprInterpreter](https://zhuanlan.zhihu.com/p/463628599)
+- [月踏 OneFlow学习笔记：从OpExprInterpreter到OpKernel](https://zhuanlan.zhihu.com/p/507471077)
+- [月踏 Autograd解析｜OneFlow学习笔记](https://zhuanlan.zhihu.com/p/514080516)
+- [郑泽康 CUDA优化之PReLU性能调优](https://zhuanlan.zhihu.com/p/515926074)
+- [赵露阳【oneflow】算子在深度学习框架中的执行及interpreter](https://zhuanlan.zhihu.com/p/523884650)
+- [许啸宇 一种分布式深度学习编程新范式：Global Tensor](https://zhuanlan.zhihu.com/p/543441584)
+- [郑建华 OneFlow源码解析（1）：算子签名的自动推断](https://zhuanlan.zhihu.com/p/535109926)
+- [郑建华 OneFlow源码解析：Op、Kernel与解释器](https://zhuanlan.zhihu.com/p/548404516)
+- [郑建华 OneFlow源码解析：算子指令在虚拟机中的执行](https://zhuanlan.zhihu.com/p/551766125)
+- [一块GPU训练TB级推荐模型不是梦，OneEmbedding性能一骑绝尘](https://zhuanlan.zhihu.com/p/552943580)
+- [郑建华 OneFlow源码解析：Tensor类型体系与Local Tensor](https://zhuanlan.zhihu.com/p/560424453)
+- [郑建华 OneFlow源码解析：Global Tensor](https://zhuanlan.zhihu.com/p/577716422)
+- [郑建华 OneFlow源码解析：自动微分机制](https://zhuanlan.zhihu.com/p/587951710)
+- [刘耀辉 适配PyTorch FX，OneFlow让量化感知训练更简单](https://zhuanlan.zhihu.com/p/611910798)
+- [郑建华 OneFlow源码解析：Eager模式下的设备管理与并发执行](https://zhuanlan.zhihu.com/p/617870143)