pandas (Software)

aus Wikipedia, der freien Enzyklopädie
pandas

Pandas logo.svg
Basisdaten

Betriebssystem Plattformunabhängig
Lizenz 3-Klausel-BSD-Lizenz
pandas.pydata.org

pandas ist eine Programmbibliothek zur Verarbeitung und Analyse von Daten in der Programmiersprache Python. Insbesondere enthält sie Datenstrukturen und Operatoren für den Zugriff auf numerische Tabellen und Zeitreihen. pandas ist Freie Software, veröffentlicht unter der 3-Klausel-BSD-Lizenz. Der Name leitet sich von dem englischen Begriff panel data (Paneldaten) ab, einer ökonometrischen Bezeichnung für Datensätze, die Beobachtungen über mehrere Zeiträume für dieselbe Untersuchungseinheit enthalten.

Beispiele

Kurven

Pandas lineplot.png
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

df = pd.DataFrame(np.random.randn(100, 5), columns=list('ABCDE'))
df=df.cumsum() # Return cumulative sum over a DataFrame or Series axis
df.plot()
plt.show()

Bar charts

Pandas bargraf.png
df = pd.DataFrame(np.random.rand(10, 5), columns=list('ABCDE'))
df.plot.bar(stacked=True)
plt.show()

Box plot

Pandas candelstick.png
df = pd.DataFrame(np.random.rand(7, 5), columns=list('ABCDE'))
df.plot.box()
plt.show()

Histogram

Pandas histogram.png
data = pd.Series(np.random.normal(size=100))
data.hist(grid=False)
plt.show()

Siehe auch

Weblinks

Einzelnachweise