Comment créer une DataFrame vide avec uniquement les noms de colonnes avec Pandas ?

La bibliothèque Pandas aide les développeurs à manipuler et analyser des données plus facilement qu'en utilisant les fonctionnalités proposées par le langage Python nativement. On peut notamment créer des DataFrame qui vont contenir les données en étant organisées en colonnes et en index. Il est possible de créer des DataFrame qui ont des colonnes vides sans forcément devoir insérer des données en même temps.

Pour créer une DataFrame avec des colonnes vides, il faut utiliser le paramètre "colums" dans le constructeur de la DataFrame. On peut alors indiquer une série contenant les colonnes désignées par leurs intitulés.

import pandas as panda
bibliotheque = panda.DataFrame(columns=['Titre','Auteur','Genre','Date de parution'])
bibliotheque
# Le résultat suivant sera affiché :
Empty DataFrame
Columns: [Titre, Auteur, Genre,'Date de parution']
Index: []

Il est également possible d'utiliser des index plutôt que des colonnes pour contenir les données. Cela permet de retrouver beaucoup plus rapidement une valeur. Il faut alors indiquer le paramètre "index".

import pandas as panda
bibliotheque = panda.DataFrame(index=range(1, 5))
bibliotheque
# Le résultat suivant sera affiché :
Empty DataFrame
Columns: []
Index: [1, 2, 3, 4, 5]

Les deux solutions peuvent être combinées pour obtenir alors une DataFrame avec des colonnes et des index, mais sans aucune donnée.

import pandas as panda
bibliotheque = panda.DataFrame(columns=['Titre','Auteur','Genre','Date de parution'], index = range(1,5))
bibliotheque
# Le résultat suivant sera affiché :
Empty DataFrame
Columns: [Titre, Auteur, Genre,'Date de parution']
Index: [1, 2, 3, 4, 5]

Autour du même sujet