pandas (Software)
aus Wikipedia, der freien Enzyklopädie
pandas
| |
---|---|
Basisdaten
| |
Betriebssystem | Plattformunabhängig |
Lizenz | 3-Klausel-BSD-Lizenz |
pandas.pydata.org |
pandas ist eine Programmbibliothek zur Verarbeitung und Analyse von Daten in der Programmiersprache Python. Insbesondere enthält sie Datenstrukturen und Operatoren für den Zugriff auf numerische Tabellen und Zeitreihen. pandas ist Freie Software, veröffentlicht unter der 3-Klausel-BSD-Lizenz. Der Name leitet sich von dem englischen Begriff panel data (Paneldaten) ab, einer ökonometrischen Bezeichnung für Datensätze, die Beobachtungen über mehrere Zeiträume für dieselbe Untersuchungseinheit enthalten.
Beispiele
Kurven
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
df = pd.DataFrame(np.random.randn(100, 5), columns=list('ABCDE'))
df=df.cumsum() # Return cumulative sum over a DataFrame or Series axis
df.plot()
plt.show()
Bar charts
df = pd.DataFrame(np.random.rand(10, 5), columns=list('ABCDE'))
df.plot.bar(stacked=True)
plt.show()
Box plot
df = pd.DataFrame(np.random.rand(7, 5), columns=list('ABCDE'))
df.plot.box()
plt.show()
Histogram
data = pd.Series(np.random.normal(size=100))
data.hist(grid=False)
plt.show()
Siehe auch
Weblinks
- Offizielle Website
- pandas – eine Bibliothek für tabellarische Daten Tutorial in deutscher Sprache
- Google Colaboratory: Quick Introduction to pandas. In: colab.research.google.com. Abgerufen am 29. Oktober 2018.