Open
Description
https://github.com/CalculatedContent/WeightWatcher
WeightWatcher (WW) 是一种开源诊断工具,用于分析深度神经网络 (DNN),无需访问训练甚至测试数据。它基于对深度学习为什么有效的理论研究,基于我们的重尾自正则化理论(HT-SR)。它使用随机矩阵理论(RMT),统计力学和强相关系统的想法。
它可用于:
分析预先训练/训练的pyTorch,Keras,DNN模型(Conv2D和Dense layers)
监视模型和模型层,以查看它们是否过度训练或过度参数化
预测不同模型的测试精度,无论有没有训练数据
在压缩或微调预训练模型时检测潜在问题
层警告标签:过度训练;训练不足
Metadata
Assignees
Labels
No labels