Comment obtenir tous les noms de colonnes d'une DataFrame Pandas ?

La librairie Pandas apporte des fonctionnalités supplémentaires à votre application Python dans l'analyse et la manipulation des données. L'un des objets les plus importants de la librairie est l'objet DataFrame, qui permet de stocker des données avec 2 dimensions : les lignes et les colonnes. Les DataFrames permettent de manipuler des quantités très importantes de données. Par défaut si l'on a une DataFrame avec trop de colonnes, l'affichage de tous les noms de colonnes sera tronqué. Il faut faire une manipulation supplémentaire pour afficher tous les noms de colonnes.

Pour obtenir les colonnes d'une DataFrame, on peut utiliser l'attribut "columns". Si votre DataFrame est trop grande, vous n'obtiendrez par défaut qu'un résultat partiel.

>>> maGrandeDataframe.columns
Index([colonne1', 'colonne2', 'colonne3',
       ...
       'colonne998', 'colonne999', 'colonne1000'],
      dtype='object', length=1000)

Pour afficher la totalité des colonnes avec cette instruction, vous devez modifier les paramètres de la librairie Pandas. Il existe 2 options gérant l'affichage : "display.max_colums", qui correspond au nombre de colonnes affichées et "display.max_rows", qui correspond aux lignes. En attribuant à ces paramètres la valeur "none", vous retirez la limite d'affichage et vous pourrez ainsi afficher la totalité des noms de colonnes. Vous pouvez le faire soit en changeant directement l'attribut, soit avec la fonction "set_option()".

Import panda as pd
//Utilisationde la méthode "setOption()"
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', None)
//Modification directe de l'attribut
pd.options.display.max_columns = None
pd.options.display.max_rows = None

Pour pouvoir afficher tous les noms de colonnes, vous pouvez également utiliser les méthodes et attributs de l'objet "columns". La méthode "toList()" transforme l'objet en liste, ce qui permet de l'afficher entièrement. On peut également utiliser la propriété "values", ce qui revient au même, car cela va afficher les noms des colonnes sous forme de liste.

>>> print(maGrandeDataframe.columns.tolist()) 
>>> print(maGrandeDataframe.columns.values)

Python