Data Literacy - Ausgewählte Kapitel (SoSe 2024)

Studiengang
Bachelor
Credits
3 CP/ECTS, äquivalent zu 2 SWS
Modul(e)
Schlüsselqualifikation
Dozenten
Semester
Sommer
Format und Zeitplan
Seminar: Freitag 12.04, 19.04, 03.05, 10.05, 07.06 (jeweils 09:00 – 16:30 Uhr)
Ort
WiWi-Pool 3
Prüfung
Schriftliche Klausur: 28.06.2024 (09:00 – 10:00 Uhr)
Sprache
German
 
 
Learnweb
 
 
Letztes Update
26.03.2024

 

Anmeldung

Die Teilnehmerzahl ist beschränkt. Eine Bewerbung erfolgt über die Bewerbungsmaske der IVV Wirtschaftswissenschaften. Die Teilnahme an der Veranstaltung wird spätestens eine Woche vor Veranstaltungsbeginn bestätigt. Bewerbungsschluss ist der 31. März 2024.

Die aktuelle Kursbeschreibung mit Rahmendaten zum Kurs finden Sie hier.

Ziel der Veranstaltung und Vorkenntnisse

Das Ziel dieser Schlüsselqualifikation ist es, Studierenden fundierte Kompetenzen im Umgang und der Arbeit mit Daten („Data Literacy“) zu vermitteln. Insbesondere erlernen die Studierenden dabei strukturiert über die Arbeit mit Daten nachzudenken, Daten zu modellieren, zu interpretieren, zu interpretieren sowie die entsprechenden praktischen Tools und Technologien entlang des Data Science-Prozesses einzusetzen. Dies schließt ein, Datenquellen hinsichtlich ihrer Glaubwürdigkeit und Relevanz zu evaluieren und datengestützte Entscheidungen zu treffen. Die Inhalte des Kurses bereiten Studierende auf eine potenzielle empirische Abschlussarbeit sowie die Realität der Arbeit mit Daten in der Praxis vor. Theoretische Vortragseinheiten (video-on-demand) wechseln sich dabei mit anwendungsbezogenen Einheiten und Übungen zur Vertiefung des Gelernten ab. Studierende sammeln (erste) Erfahrungen im Umgang mit Python sowie Tableau. Der Fokus liegt hierbei auf einer überblicksartigen Wissensvermittlung und hat nicht den Anspruch eines tiefgehenden Programmierkurses. Es wird erwartet, dass die Studierenden ein intrinsisches Interesse an den behandelten Themen mitbringen und sich aktiv einbringen. Die individuelle Lernkurve hängt dabei von der eigenen Motivation sowie den Vorkenntnissen der Studierenden ab und kann eine konsequente Nachbereitung der Inhalte zwischen der Veranstaltungsterminen erfordern. Generell sollten Teilnehmer:innen folgende Vorkenntnisse mitbringen:

  1. Erfolgreicher Abschluss der Module „Statistik 1“ (bzw. "Data Science 1" nach neuer PO) und „Statistik 2“ (bzw. "Data Science 2" nach neuer PO) und „Mathematik für Wirtschaftswissenschaftlicher“ (bzw. "Analysis für Wirtschaftswissenschaftler" nach neuer PO).
  2. Vorkenntnisse im Umgang mit Python oder einer anderen Programmiersprache zur Datenanalyse sind nicht erforderlich. Gleiches gilt für Tableau.
  3. Hinweis: Interessierte Studierende können parallel zur Veranstaltung den von Dr. Schmitting angebotenen Kurs Programmierung mit Python besuchen. Eine Belegung ist optional und nicht notwendig für den erfolgreichen Abschluss dieses Kurses.

 

Inhalte

Themen

Beschreibung

Einführung „Data Literacy“

Die Veranstaltung startet mit einer ausführlichen Beschreibung und Reflektion des Konzeptes der „Data Literacy“. Dabei wird zunächst der Begriff der „Daten“ geklärt. Anschließend wird die Motivation der Data Literacy untersucht. Sie wird definiert, gegen verwandte Konzepte abgegrenzt und mögliche Inhalte werden anhand des Kompetenzrahmens von Ridsdale et al. (2015) aufgezeigt. Fundierende oder verbundene Themen werden dabei im Zusammenhang erörtert. Letztendlich sollte jeder Teilnehmer den Begriff für sein Verständnis definieren können. Im zweiten Block wird dann der Frage nachgegangen, wo und wie sich über das Internet Informationen und Daten zu ausgewählten Themen finden lassen. Dabei gilt die Aufmerksamkeit sowohl der allgemeinen Recherche wie auch der Identifikation von Datenquellen. Abschließend wird im dritten Block exemplarisch einem besonderen Phänomen in der Datenanalyse nachgegangen.

Simulationsrechnung

Einführung in die Simulation. Vorstellung eines Anwendungsfalles (Unternehmensplanspiel zur Lagerhaltung). Im Weiteren wird dann unter Python ein Simulationsmodell dieses Spiels entwickelt, mit welchem die beste Spielpolitik bestimmt werden soll. Die Tabellenkalkulation Excel wird zur Visualisierung der Simulationsergebnisse herangezogen. Die Ergebnisse werden analysiert und interpretiert. Zielführende Entscheidungsempfehlungen werden abgeleitet.

Datenvisualisierung

Im Rahmen einer Einführung wird die Gestaltung von Standard-Businessgrafiken (auch praktisch unter Nutzung von Excel) vermittelt. Es wird darüber hinaus auf „exotische“ Grafikformen sowie den Missbrauch grafischer Darstellungen eingegangen. Das Thema Visual Analytics bildet den Übergang zu einer Einführung in die Software „Tableau“, die nicht nur die Visualisierung, sondern auch die Datenanalyse unterstützt. Übungen zu den einzelnen Themen runden den Einblick in die Datenvisualisierung ab.

Datenmanipulation &
Datenanalyse mit Python

Zunächst Diskussion des Begriffs „Data Science“ sowie Überblick über den Data Science Prozess. Es folgt eine grundlegende Einführung in die Programmiersprache Python mit diversen Anwendungsbeispielen. Der Großteil des Themenblockes besteht dann aus der praktischen Arbeit mit tabellarischen Daten in Python, insb. Datenmanipulation und Datenanalyse mit der Python Library Pandas.

Generative KI &
Large Language Models

Einführung in die Verwendung und Anwendungsmöglichkeiten generativer KI mit einem Fokus auf Sprachmodelle (Large Language Models, LLMs) wie ChatGPT (OpenAI) oder Gemini (Google). Es wird sowohl das Training dieser Modelle als auch deren Funktionsweise und Anwendungsfälle im betriebswirtschaftlichen Kontext diskutiert. Darüber hinaus behandelt die Vorlesung verschiedene Tipps und Hinweise zur richtigen Verwendung von Sprachmodellen (bzw. Chatbots wie ChatGPT): dem sogenannten „Prompt Engineering“.

Korrelation &
Kausalität

Der Themenblock zielt auf die Verinnerlichung von Denkmustern ab, die es erlauben, Korrelationen von kausalen Zusammenhängen zu unterscheiden. Es werden einige Strategien zur Identifikation von kausalen Zusammenhängen besprochen, die es ermöglichen kausale Ursachen-Wirkungs-Beziehungen messbar zu machen.

Datenbeschaffung mittels API

(optional)

Die letzte Vorlesungseinheit gibt einen kurzen Überblick über Programmierschnittstellen (sog. Application Programming Interfaces oder „APIs“), wo diese überall im Internet zu finden sind und wie sie zur Datenbeschaffung genutzt werden können. Es werden einige frei zugängliche Schnittstellen exemplarisch vorgestellt und angewandt (z.B. zum Zwecke der maschinellen Übersetzung, Transkription von Audio-Dateien oder Generierung von Musik-Empfehlungen).

Verarbeitung von Textdaten

(optional)

Einführung in die maschinelle Verarbeitung von Textdaten, insb. Datenaufbereitung mittel Regular Expression (Regex) und quantitative Analyse von Textinhalten. Dabei werden beispielhaft einige wesentliche Methoden und Konzepte aus dem Bereich Natural Language Processing (NLP) vorgestellt.

 

Erworbene Kompetenzen

Neben dem übergreifenden Ziel der Vermittlung von Kompetenzen im Umgang mit Daten („Data Literacy“) sind die Teilnehmer:innen nach erfolgreichem Abschluss der Veranstaltung in der Lage

  • die Relevanz von „Data Literacy“ im 21. Jahrhundert einzuordnen.
  • strukturiert über Fragestellungen zu reflektieren, zu deren Beantwortung die Analyse von Daten entscheidend ist. Dies beinhaltet die eigenständige Datenbeschaffung, Datenbereinigung und -manipulation, Datenanalyse sowie Datenvisualisierung.
  • mit modernen und praxisrelevanten Datenanalyse-Tools umzugehen, insbesondere Python und Tableau.
  • zwischen assoziativen (Korrelationen) und kausalen Ursachen-Wirkungs-Beziehungen (Kausalität) zu unterscheiden, die Gültigkeit augenscheinlich kausaler Aussagen kritisch zu hinterfragen und Fallstricke wie Verzerrungen und Fehlinterpretationen zu erkennen.
  • die Wichtigkeit und den Wert von APIs (Programmierschnittstellen) im Internet zu erkennen und diese selbstständig zu verwenden.
  • die Funktionsweise von generativen KI Modellen, insb. Sprachmodellen (Large Language Models, LLMs), zu hinterfragen und diese korrekt für eigene Anwendungsfälle zu nutzen.
  • datengestützte Analysen zu verstehen und eigenständige empirische (Abschluss-)Arbeiten durchzuführen.

 

Prüfungsleistung

Für eine erfolgreiche Teilnahme und Anrechnung ist die Anwesenheit und aktive Mitarbeit an allen fünf Terminen sowie das Bestehen einer 60-minütigen Abschlussklausur erforderlich.