Skip to content

WeightWatcher 权重观察者 #15

Open
@ziwang-com

Description

https://github.com/CalculatedContent/WeightWatcher
WeightWatcher (WW) 是一种开源诊断工具,用于分析深度神经网络 (DNN),无需访问训练甚至测试数据。它基于对深度学习为什么有效的理论研究,基于我们的重尾自正则化理论(HT-SR)。它使用随机矩阵理论(RMT),统计力学和强相关系统的想法。

它可用于:

分析预先训练/训练的pyTorch,Keras,DNN模型(Conv2D和Dense layers)
监视模型和模型层,以查看它们是否过度训练或过度参数化
预测不同模型的测试精度,无论有没有训练数据
在压缩或微调预训练模型时检测潜在问题
层警告标签:过度训练;训练不足

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions