Nous allons utiliser github codespaces pour ce TP
- Lisez la documentation pour comprendre ce qu'est le Codespace
- Créez un compte github
- Lancez un codespace depuis ce repository
- Vous devriez voir apparaître un visual studio code dans votre navigateur web
- Attendez la fin de l'installation
- Lancez la commande
export LOCALTILESERVER_CLIENT_PREFIX='proxy/{port}'
dans un terminal - Lancez
jupyter lab
dans un terminal, puis copiez le token qui s'affiche - Ouvrez le jupyterlab en vous rendant dans "ports" puis en copiant l'URL donnée
- Allez dans
2_hands_on
et parcourez les notebooks
Il est conseillé de changer le type de machine pour prendre une machine à 4 CPU
Pour avoir plus d'informations sur dask, voici le slidedeck d'introduction
Effectuez les notebooks suivants dans l'ordre:
Notebooks d'introduction à Dask
- 00_overview.ipynb
- 01_array.ipynb
- 02_dask.delayed.ipynb
- 03_distributed.ipynb
- 04_futures.ipynb
Notebook d'application au traitement d'images
- 05_image_processing.ipynb
Notebook d'exercice:
- 06_cloud_detector.ipynb
Si cela vous intéresse, le site de Dask donne accès à de nombreux guides supplémentaires, notamment ce tutorial qui parcours les fonctionnalités offertes par dask à la fois en traitement de données mais aussi en apprentissage automatique.