Releases: ColinMaudry/decp-processing
Releases · ColinMaudry/decp-processing
v2.9.1
v2.9.0
- Ajout du champ
typequi indique le type de marché : fournitures, services ou travaux (dérivé du code CPV) distancerenommétitulaire_distancepar cohérence, cette donnée étant liée au titulaire, et un marché peut avoir plusieurs titulaires
v2.8.0: - Ajout du champ `titulaire_categorie` (PME, ETI, GE)
- Ajout du champ
titulaire_categorie(PME, ETI, GE) - Publication de statistiques sur les marchés publics (statistiques_marches.json)
- Publication de statistiques sur les doublons entre sources de données (statistiques-doublons-sources.parquet)
- Ignorer les petits fichiers vides (< 180 octets)
v2.7.1
- Gestion des datasets dépubliés par leur propriétaire (arrêt du workflow pour ne pas écraser les données de prod et pouvoir en extraire les données à présent indisponibles)
v2.7.0: - Remplacement des guillemets simples par des apostrophes dans "objet"
v2.6.4
v2.6.3
v2.6.2
- Réduction du nombre de tâches prefect pour réduire la charge sur la BDD et la latence
- Utilisation du multithreading standard de Python plutôt que celui de Prefect
- Le nom d'établissement n'est ajouté entre parenthèses que s'il est différent de celui de l'unité légale
v2.6.1: - Séparation des fichiers de référence et des fichiers de données
- Séparation des fichiers de référence et des fichiers de données
- Réorganisation des variables d'environnement
- Correction de certains imports de modules
v2.6.0
- Abandon des données consolidées par le MINEF, récupération des données à la source (#151)
- Xmarchés
- AWS (officiel et legacy)
- PES marché (avant et après 2024)
- Dematis / e-marchespublics
- Ajout du champ
dureeRestanteMois(#135) - Amélioration des noms des titulaires (personnes physiques et non-diffusibles) (#145)
- Ajout de nombreux tests unitaires
- Amélioration de la gestion des modifications (#148)
- Traitement des ressources en parallèle (#113)
- Optimisation de la consommation de mémoire (matérialisation en parquet) (#153)
- Résilience contre les erreurs pendant get_clean (seule la ressource échoue, pas tout le process)
- Mise en place d'un système de cache custom (parquet)
- Protection contre la publication par erreur sur data.gouv.fr (ffaf0535)