Bonjour,
Sur le lien de téléchargement de la version 22.0 https://bilans-ges.ademe.fr/docutheque/ ... _V22.0.zip depuis ce site, je trouve beaucoup de problèmes de valeur, notamment pour les "Type Ligne" = "Poste".
Allons sur https://data.ademe.fr/datasets/base-carbone(r)/full et filtrons sur "Identifiant de l'élément" = "12892". Il y aura 3 lignes, la première pour l'élément final et les 2 suivantes pour les "Poste" d'émission. On s'attend à ce que la valeur de la colonne "Total poste non décomposé" soit de la première ligne soit égale à la somme des valeurs des autres lignes.
C'est le cas sur ce site, nous trouvons les valeurs de 0.37, 0.344 et 0.026. Et 0.344 + 0.026 = 0.37.
Par contre, refaites la même chose depuis le CSV contenu dans le ZIP https://bilans-ges.ademe.fr/docutheque/ ... _V22.0.zip.
Vous trouverez une erreur
0,37
344
26
Il manque vraisemblablement les virgules pour les Poste. Ce problème apparait sur des centaines de lignes.
Je pense que votre fichier est mal formatté et inutilisable. Il faut rapidement re-uploader un fichier correct et notifier les utilisateurs de l'erratum au plus vite. Toute analyse faite avec ce fichier sera malheureusement fausse de plusieurs ordres de grandeur, et l'utilisateur ne pourra pas toujours s'en rendre compte à temps.
NB. Il serait bien de mettre en place des systèmes de vérification des données que vous uploadez, le nombre d'utilisateurs de vos données étant important, ainsi que les enjeux.
Je me tiens à votre disposition si besoin d'aide. Le plus simple est sûrement de ne pas avoir deux jeux de données différents entre bilans-ges.ademe.fr et data.ademe.fr.
Merci !
Selim Youssry