Rappel sur les niveaux d’index des Dataframes pandas .

Levels

Les levels font partie intégrante de l’index ou de la colonne.

Contruisons un dataframe illustrant le rapport d’ une équipe support mettant en avant le numero d’incident, le temps passé dessus, et l’utilisateur ayant travaillé sur cet incident.


firstReport = pd.DataFrame([
[1, 10, 'Eric'],
[1, 20, 'Eric'],
[1, 30, 'Marc'],
[1, 10, 'Bob'],
[2, 25, 'Eric'],
[2, 15, 'Bob']], columns = ['IncidentNumber','TimeSpent','User'])

L’index ici n’a qu’un seul niveau (il n’y a qu’une seule valeur d’index identifiant chaque ligne). L’index est artificiel (nombre courant) et se compose de valeurs de 0 à 5.

Somme

Disons que nous voulons fusionner (additionner) tous les journaux créés par le même utilisateur au même problème (pour obtenir le temps total consacré au problème par l’utilisateur)


time_logged_by_user = report.groupby(['IncidentNumber', 'User']).TimeSpent.sum()

  1. Maintenant, notre index de données a 2 niveaux, car plusieurs utilisateurs ont enregistré l’heure sur le même problème.
  2. Les niveaux sont IncientNumbet et User.
  3. Les niveaux font partie de l’index (seulement ensemble, ils peuvent identifier une ligne dans un DataFrame / Series).

Leave a Reply

Your email address will not be published. Required fields are marked *