Model Optimisation Techniques Implementation: Quantisation, Compression Techniques with Knowledge Distillation

This repository contains a curated list of different ways of optimization and compression techiniques for the Machine Learning Models. IIIT-Hyderabad College Project on exploring these techniques.

Here is a demo of the project:

Main Content

Concepts

Model Compression and Architecture Optimization

Compression Techniques
- Pruning
- Quantization
- hashing
- Knowledge Distillation
- Low-Rank Approximation
- Precision reduction [ Floating Point Operation, Floating Point Operations per Second, Multiply-Accumulate Computations [ 1 MAC = 2 FLOPs ] ]
Architecture Optimization
- Architecture Changes
- Neural Architecture Search

Raw listing

List of all possible ways of optimization

Pruning : Removing redundant connections present in the architecture. Pruning involves cutting out unimportant weights (which are usually defined as weights with small absolute value).
- Unstructured Pruning
- Structured Pruning
Quantization: Quantization involves bundling weights together by clustering them or rounding them off so that the same number of connections can be represented using lesser amount of memory.
- Dynamic Quantization
- Static Quantization
- Quantization Aware training
ONNX conversion and ONNX Runtime
Distillation
coreML for mobile device
Neural Architecture Search (NAS)
Low-Rank Approximation

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
demoVideo		demoVideo
out_files.nosync		out_files.nosync
1_Model_Metrics_Basics.ipynb		1_Model_Metrics_Basics.ipynb
2_Separable_Conv.ipynb		2_Separable_Conv.ipynb
Knowledge_Distillation_Approach.ipynb		Knowledge_Distillation_Approach.ipynb
Knowledge_Distillation_Approach.py		Knowledge_Distillation_Approach.py
README.md		README.md
Static_Quantization.ipynb		Static_Quantization.ipynb
Static_Quantization.py		Static_Quantization.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Model Optimisation Techniques Implementation: Quantisation, Compression Techniques with Knowledge Distillation

Main Content

Concepts

Raw listing

References

About

Uh oh!

Releases

Packages

Languages

prtk1729/Compression_and_Quantisation_Techniques

Folders and files

Latest commit

History

Repository files navigation

Model Optimisation Techniques Implementation: Quantisation, Compression Techniques with Knowledge Distillation

Main Content

Concepts

Raw listing

References

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages