🐼 Pandas?#

Pandas ist eine Open-Source-Bibliothek für Datenanalyse und Datenmanipulation in Python. Sie ermöglicht das Arbeiten mit tabellarischen Daten (ähnlich wie Excel, CSV, SQL oder DataFrames in R) – aber viel mächtiger.

Mit Pandas kannst du:

Daten einlesen, sortieren, filtern, gruppieren, zusammenfassen, berechnen, plotten und exportieren komplexe Datenanalysen elegant und effizient durchführen

🧭 Übersicht: Themenplan „Pandas – Grundlagen der Datenanalyse“#

📘 Abschnitt 1 – Einführung in Pandas#

  • Was ist Pandas? Warum braucht man es?

  • Series und DataFrame: die zentralen Objekte

  • Einlesen von CSV-Dateien mit pd.read_csv()

  • Erste Methoden: .head(), .tail(), .info(), .describe()

  • Zugriff auf Spalten & Zeilen: df[“Spalte”], df.loc[], df.iloc[]

  • 🔧 Übung: Lade personen.csv ein, gib nur die Spalten „Name“ und „Stadt“ aus

📘 Abschnitt 2 – Arbeiten mit DataFrames#

  • Auswahl & Filterung von Daten (df[df[“Spalte”] > 10])

  • Neue Spalten berechnen (df[“BMI”] = …)

  • Datentypen, Umwandlungen (astype, to_numeric)

  • Fehlende Werte: isnull(), fillna(), dropna()

  • 🔧 Übung: Berechne aus „Größe“ und „Gewicht“ die BMI-Spalte, entferne unvollständige Zeilen

📘 Abschnitt 3 – Gruppieren, Aggregieren & Statistiken#

  • Gruppierung mit groupby()

  • Aggregation: .mean(), .sum(), .count(), .agg()

  • Pivot-Tabellen

  • Häufigkeiten mit value_counts()

  • 🔧 Übung: Analysiere Durchschnittsalter nach Studiengang, häufigste Werte

📘 Abschnitt 4 – Sortieren, Filtern, Kombinieren#

  • Sortieren mit .sort_values()

  • Logische Filter & Kombination (&, |)

  • Kombinieren von DataFrames mit merge() und concat()

  • Beispiel: CSV mit Personen und CSV mit Studiengängen verbinden

  • 🔧 Übung: Füge Datensätze aus zwei CSV-Dateien sinnvoll zusammen

📘 Abschnitt 5 – Zeitreihen & Daten speichern#

  • Datumsangaben als datetime verarbeiten (pd.to_datetime())

  • Zeitreihen analysieren: .resample(), .dt.year, .dt.month

  • Export nach CSV, Excel, JSON (.to_csv(), .to_excel(), .to_json())

  • 🔧 Übung: Lade Wetterdaten, berechne monatliche Durchschnittstemperatur

📘 Abschnitt 6 – Projekt & Visualisierung (Bonus)#

  • Abschlussprojekt: Freie Datenanalyse mit echten Daten (z. B. OpenData, Umfrage, Klima)

  • Einführung in matplotlib oder pandas.plot()

  • Präsentation & Interpretation der Ergebnisse

  • 🔧 Projektideen: Schlaf- & Stressauswertung Öffentliche Verkehrsdaten analysieren Fußballstatistiken vergleichen