InfluxDB - Écriture de données au format CSV avec la commande 'influx write'

Après les billets précédents sur l'installation et la prise en main d'InfluxDB, voici comment écrire dans la base des données au format CSV avec la commande 'influx write', puis comment les visualiser avec le Data Explorer de l'Interface Utilisateur.

Les données au format CSV

Nous allons utiliser les données obtenues dans le billet Plotly - Température dans les stations Châtelet et Franklin D. Roosevelt, à savoir les deux fichiers au format CSV :

Écriture en base des données du fichier data_chatelet_clean.csv

  1. Création de l'organisation ratp_org :
    influx org create --name ratp_org
  2. Création du bucket ratp_bucket rattaché à l'organisation ratp_org avec une période de rétention infinie :
    influx bucket create -n ratp_bucket -o ratp_org -r 0
  3. Écriture des données avec la commande influx write :
    influx write -b ratp_bucket -o ratp_org \
        -f data_chatelet_clean.csv \
        --header "#constant measurement,qualite-air" \
        --header "#constant tag,station,chatelet" \
        --header "#datatype dateTime,double,double,double,double,double,double"
    Les messages d'erreurs no field data found et Unable to batcher to error-file: invalid argument correspondent à des lignes sans donnée, comme par exemple :
    2022-08-22T10:00:00+02:00,,,,,,
    

Écriture des données du fichier data_franklin-d-roosevelt_clean.csv

Pour le fichier data_franklin-d-roosevelt_clean.csv nous allons procéder différemment. Au lieu de préciser les en-têtes étendus dans la commande influx write nous allons les ajouter au début du fichier CSV.

  1. Pour cela on commence par copier le fichier data_franklin-d-roosevelt_clean.csv en data_franklin-d-roosevelt_clean2.csv.
  2. Puis en début du fichier data_franklin-d-roosevelt_clean2.csv on ajoute les 3 lignes d'en-têtes, ce qui donne :
    #constant measurement,qualite-air
    #constant tag,station,roosevelt
    #datatype dateTime,double,double,double,double,double,double
    
    Ce qui donne :
    #constant measurement,qualite-air
    #constant tag,station,roosevelt
    #datatype dateTime,double,double,double,double,double,double
    date/heure,NO,NO2,PM10,CO2,TEMP,HUMI
    2022-09-12T02:00:00+02:00,3,34,34,477,23.8,53.9
    2022-09-12T01:00:00+02:00,4,42,29,480,23.9,52.2
    2022-09-12T00:00:00+02:00,4,39,40,489,24,51.5
    2022-09-11T23:00:00+02:00,2,28,24,484,23.9,50.4
    2022-09-11T22:00:00+02:00,4,30,13,479,24.1,48.1
    2022-09-11T21:00:00+02:00,3,27,26,467,24.2,47.8
    
  3. Écriture des données avec la commande influx write :
    influx write -b ratp_bucket -o ratp_org -f data_franklin-d-roosevelt_clean2.csv

Visualisation des données avec l'Interface Utilisateur

Nous pouvons maintenant visualiser les données avec l'interface utilisateur d'InfluxDB (http://localhost:8086/).

  1. Dans l'écran Data Explorer on retrouve bien le bucket ratp_bucket créé précédemment :
  1. Puis on renseigne le Custom Time Range pour travailler sur les données entre les 1er janvier et 1 septembre 2022 :
  1. On remarque que le measurement qualite-air est maintenant affiché :
  1. On peut alors sélectionner le measurement qualite-air, puis le field TEMP, puis chatelet et roosevelt pour le tag station. Enfin on clique sur le bouton SUBMIT pour afficher les deux courbes de température :