🐼 Einführung in Pandas

🐼 Einführung in Pandas#

pip install pandas

import pandas as pd

s = pd.Series([10, 20, 30])
print(s)

➡️ Eine 1-dimensionale Liste mit Index

daten = {
    "Name": ["Anna", "Ben", "Clara"],
    "Alter": [22, 23, 21]
}

df = pd.DataFrame(daten)
print(df)

➡️ Mehrere Spalten mit Beschriftung

# personen.csv
Name,Alter,Stadt
Anna,22,Berlin
Ben,23,Hamburg
Clara,21,München

df = pd.read_csv("personen.csv")
print(df)

Methode	Bedeutung
`df.head()`	Erste 5 Zeilen
`df.tail()`	Letzte 5 Zeilen
`df.info()`	Übersicht: Spalten, Typen, Nullwerte
`df.describe()`	Statistische Kennzahlen (für Zahlen)
`df.columns`	Liste aller Spaltennamen
`df.shape`	Anzahl Zeilen und Spalten

Spalte auswählen:

df["Name"]

Mehrere Spalten auswählen:

df[["Name", "Stadt"]]

Zeile nach Index:

df.iloc[0]    # Zeile 0
df.loc[1]     # Zeile mit Index 1

Pandas bietet zwei Methoden, um auf Zeilen oder Ausschnitte eines DataFrames zuzugreifen:

Zugriffsmethode	Zugriff über…	Was es bedeutet
`iloc`	position (Indexnummer)	Zugriff auf Zeilen/Spalten nach Reihenfolge
`loc`	label (Indexwert)	Zugriff über explizite Bezeichnung

import pandas as pd

daten = {
    "Name": ["Anna", "Ben", "Clara"],
    "Alter": [22, 23, 21]
}
df = pd.DataFrame(daten, index=["a", "b", "c"])

print(df.iloc[0])

Name     Anna
Alter      22
Name: a, dtype: object

print(df.loc["a"])

Name     Anna
Alter      22
Name: a, dtype: object

df["Geburtsjahr"] = 2024 - df["Alter"]

✍️ übungsaufgabe: