Les formats suivants sont disponibles pour le téléchargement de données :
Format texte (TSV ou CSV)
Format JSON-STAT
Format XLSX
Format SDMX
Format texte (TSV ou CSV)
TSV signifie Tab Separated Value. Un fichier TSV est un fichier plat, qui inclut un délimiteur sous forme de tabulation, qui est utilisé dans les logiciels de tableurs et qui contient une série temporelle par ligne.
CSV signifie Comma Separated Value. Un fichier CSV est un fichier plat, qui inclut un délimiteur sous forme de virgule, qui est utilisé dans les logiciels de tableurs et qui contient une observation par ligne.
Voici un exemple de fichier de données TSV pour un ensemble de données comprenant une série temporelle unique :
FREQ,CURRENCY,POST,STK_FLOW,S_ADJ,PARTNER,GEO/TIME_PERIOD | 1999-01 | 1999-02 | 1999-03 | 1999-04 | 1999-05 |
M,MIO_EUR,010,CRE,NSA,EXT_EA16,EA16 | 100001 | 96664 | 114413 | 107945 | 107837 |
Voici un exemple de fichier de données pour un ensemble de données comprenant de multiples séries temporelles:
FREQ,CURRENCY,POST,STK_FLOW,S_ADJ,PARTNER,GEO/TIME_PERIOD | 1999 | 1999-01 | 1999-02 | 1999-03 | 1999-04 | 1999-05 |
A,MIO_EUR,010,CRE,NSA,EXT_EA16,EA16 | 1353651 | : | : | : | : | : |
M,MIO_EUR,010,CRE,NSA,EXT_EA16,EA16 | : | 100001 | 96664 | 114413 | 107945 | 107837 |
Première colonne - la ligne d’en-tête est écrite en caractères majuscules.
Première colonne - première ligne: séquence de codes séparés par une virgule suivie d’un code séparé par une barre oblique inverse (\).
Les codes séparés par une virgule (,) sont les identifiants des dimensions. Ils sont utilisés pour identifier les séries chronologiques.
Ligne d’en-tête: la lettre dans la colonne FREQ représente la fréquence.
Les périodes sont triées par ordre croissant.
La notation pour Code de période est la suivante:
pour l’année: YYYY (ex: 2018)
pour le semestre: YYYY-SN (ex: 2015-S1)
pour le trimestre: YYYY-QN (ex: 2015-Q1)
pour le mois: YYYY-NN (ex: 2015-01)
Utilisation de deux-points (:): Une cellule contient un deux-points si aucune valeur n’est disponible pour une période donnée. autrement dit, le signe deux-points signifie non disponible.
Toutes les autres colonnes (sauf sur la première ligne): valeurs ou deux-points (:). Les drapeaux sont attachés aux valeurs lorsqu’ils sont disponibles. La valeur est séparée de drapeaux éventuels par un espace blanc.
Le symbole décimal utilisé est le point (.).
Avec une série chronologique multiple:
S’il y a deux fréquences, par exemple A et M, il y aura deux séries temporelles distinctes:
Une série temporelle pour les données annuelles (FREQ = A)
Une série temporelle pour les données mensuelles (FREQ = M)
Pour une période qui ne correspond pas à la fréquence indiquée dans la clé de série, le signe deux points signifie non applicable. Par exemple, si la clé de la série indique A (annuel) comme fréquence, il ne peut pas y avoir de valeur pour une période mensuelle.
Voici un exemple avec une série temporelle multiple:
FREQ,CURRENCY,POST,STK_FLOW,S_ADJ,PARTNER,GEO/TIME_PERIOD | 1999 | 1999-01 |
A,MIO_EUR,010,CRE,NSA,EXT_EA16,EA16 | 1353651 | : |
M,MIO_EUR,010,CRE,NSA,EXT_EA16,EA16 | : | 100001 |
Doit être interprété comme:
FREQ,CURRENCY,POST,STK_FLOW,S_ADJ,PARTNER,GEO/TIME_PERIOD | 1999 | 1999-01 |
A,MIO_EUR,010,CRE,NSA,EXT_EA16,EA16 | 1353651 | Non applicable |
M,MIO_EUR,010,CRE,NSA,EXT_EA16,EA16 | Non applicable | 100001 |
Format JSON-stat
Le format JSON-stat est un format de dissémination JSON simple et léger adapté à la visualisation des données, aux applications mobiles et aux initiatives de données ouverte.
Pour davantage d’informations à propos de ce format, merci de consulter le site json-stat.org.
Format XLSX (Feuille de calcul)
Le format XLSX est basé sur un format XML, qui peut être utilisé par des tableurs. Les données sont stockées dans un fichier texte qui utilise XML pour définir tous ses paramètres.
Ce format est uniquement disponible pour les ensembles de données dont la taille n’excède pas 750.000 cellules.
Format SDMX
L’initiative SDMX (Statistical Data and Metadata Exchange) est sponsorisée par sept institutions (la BRI, la BCE, Eurostat, FMI, l’OCDE, l’ONU et la Banque mondiale) et vise à fournir des standards en matière d’échange d’informations statistiques.
Cette norme décrit et universalise le moyen d’échanger des données statistiques et fournit des formats standardisés pour les données et les métadonnées, des lignes directrices relatives au contenu ainsi qu’une architecture IT permettant l’échange de données et de métadonnées.
Le format des messages SDMX possède deux expressions basiques: SDMX-ML (qui utilise la syntaxe XML) et SDMX-CSV (voir les spécifications (en anglais)).