Skip to main content
Home
Podcast Facebook Twitter LinkedIn YouTube RSSRSS Newsletter
  • DE
  • EN

Search form

Wer hat Angst vor Schlangen? – Wie Python in Göttingen zum Data-Literacy-Werkzeug wurde

Dieser Beitrag gehört zum Dossier:
Dossier

Data Literacy

Data Literacy gilt als zentrale Zukunftskompetenz. Aktuelle Ansätze und neue Entwicklungen zur Vermittlung von Data Literacy im Dossier.
Data has a better idea

Ist nun R oder Python besser? Dieser Frage mussten sich Dr. Jana Lasser, Dr. Alexander Silbersdorff und Dr. Benjamin Säfken in dem Projekt Daten Lesen Lernen an der Universität Göttingen stellen. Im diesem Blogpost teilen sie ihre Erfahrungen mit der HFD-Community. 

Die Uni Göttingen hat sich mit dem Projekt Daten Lesen Lernen das Ziel gesetzt, Studierenden aller Fachrichtungen die Grundlagen im Umgang mit Daten zu vermitteln. Die Umsetzung des Projektes wird durch eine Förderung des Stifterverbandes und der Heinz Nixdorf Stiftung ermöglicht. Die zweite Runde einer neu geschaffenen Lehrveranstaltung ist im April gestartet. Aufgrund der aktuellen Situation als vollständig digitale Veranstaltung. Das Projekt verankert Data Literacy nachhaltig in der Ausbildung der Universität Göttingen.

In unserem Blog-Post 1 Jahr "Daten Lesen Lernen" an der Universität Göttingen vom November letzten Jahres, haben wir nach einem knappen Jahr Projektlaufzeit ein kleines erstes Resumée gezogen. Darin haben wir eine auch bei uns heiß diskutierte Frage außen vor gelassen, die Frage: R oder Python? Dieser Frage wollen wir uns in diesem Post widmen und den Entscheidungsweg in Göttingen beschreiben.

Daten Lesen Lernen Uni GöttingenWer hat Angst vor Schlangen? Eignet sich Python als Tool besser für interdisziplinäre Data Literacy Education? Bild: Daten Lesen Lernen Göttingen

 

Die Frage aller Fragen

Die Word Cloud als Birne ist schnell zum Symbol für unser Göttinger Daten Lesen Lernen Projekt geworden. Sie veranschaulicht gut, wie breit unser Team aufgestellt ist. Ob Archäolog*innen, Philolog*innen, Ökonom*innen, Informatik*innen, Physiker*innen oder Statistiker*innen, alle sollen sich in unserem Projekt wiederfinden. Viele Leute aus unterschiedlichsten Fachrichtungen in ein Projekt einzubinden ist nicht einfach. Auch das spiegelt sich in der Daten-Lesen-Lernen-Birne. Wer einen genauen Blick darauf wirft, erkennt sowohl das Python als auch das R-Symbol. Nichts hat die unterschiedlichen Fachkulturen klarer getrennt als die Frage nach dem passenden Werkzeug für Data Literacy.

Die erste Frage in der Planungsphase war noch einfach zu beantworten: Brauchen wir eine Software? Oder reicht es, wenn wir uns dem Thema theoretisch nähern? Klar brauchen wir ein Datenanalysetool! Unser Ansatz sollte praxisorientiert sein. Wir wollten, dass unsere Studierenden nicht nur die datenbasierten Schlüsse anderer beurteilen können, sondern auch selbst Schlüsse aus Daten ziehen können. Das war und ist für uns gelebte Datenkompetenz. Schon das ist eine Herausforderung. Der Kurs in Göttingen richtet sich an ja an Student*innen ohne jede Vorerfahrung im Programmieren. Wir wollen ja grade Germanist*innen und Archäolog*innen erreichen. Das Excel trotzdem nicht passt, war auch schnell klar. Weder zu unseren Inhalten noch zu dem angestrebten Charakter der Digitalität. So blieb die bekannte Frage: R oder Python?

 

Datenwisssenschaftler aller Fachkulturen, vereinigt euch!

Gute Data Literacy Education lebt nicht nur von der unbestrittenen Relevanz ihrer Inhalte, sondern auch von der Begeisterung der Lehrpersonen. Die Begeisterung für die gelehrten Inhalte der Göttinger Data-Literacy-Veranstaltung ist ein elementarer Pfeiler für ihren Erfolg. Ohne die Leidenschaft der Lehrenden wird auch die konzeptionell beste Data-Literacy-Veranstaltung dröge und scheitert daran, die Studierenden mitzureißen. Mit der gleichen Leidenschaft haben wir uns der Frage R vs Python gewidmet. Das ist natürlich ein emotionales Thema. Wir Datenwissenschaftler*innen verbringen mit der Software unserer Wahl aktuell wohl mehr Zeit als mit unseren Partner*innen. Und wer will schon mit lieb gewonnenen Gewohnheiten und Überzeugungen brechen und eine Lehrveranstaltung in einer fremden Softwareumgebung halten?

So hat sich auch unser Göttinger Daten-Lesen-Lernen-Projekt in den schwelenden Streit innerhalb der Datenwissenschaften eingereiht. Die Lager ließen sich grob verschiedenen Fachrichtungen zuordnen. Informatik und Physik im Lager der Python-Befürworter*innen. Statistik und Ökonomie im R-Lager. Die Philologie im Gewand der Digital Humanities eher bei Python, die Archäologie eher bei R. Natürlich kamen in der Diskussion die üblichen Argumente auf. Die gleichen Argumente und Themen, die zehntausendfach in den zahlreichen Internetforen und Blogs wiedergegeben werden: Objektorientierung, Pakete laden, diese oder jene Anwendung, Anschlussfähigkeit an die Community, etc.

In unserer Diskussion haben am Ende eher praktische Argumente überwogen: Wo finden wir eigentlich mehr und passende Tutor*innen? In welcher Sprache haben wir mehr Ressourcen und besseres Material?

So haben wir uns am Ende für Python entschieden. Zusammen mit Jupyter Notebooks. Dafür musste die eine Hälfte der Lehrenden kurzfristig auf Python umsteigen. Die Veranstaltung war trotzdem (oder grade deswegen?) ein Erfolg. Für die Studierenden und die Lehrenden. Das wäre sie mit R vermutlich auch gewesen. Natürlich sind auch Schwierigkeiten aufgetreten. Gerade weil unsere Veranstaltung auf absolute Programmieranfänger*innen abzielt und Python eine vollwertige Programmiersprache ist. Einige der Probleme wollen wir hier wiedergeben:

  • Der Unterschied zwischen einer Funktion und einer Methode. Wann rufe ich eine Funktion mit Parametern in den Klammern auf? Wann wende ich mittels „.“ eine Methode auf ein Objekt an? Wir haben keine Objektorientierung behandelt. Ohne ist eine sinnvolle Erklärung schwierig.
  • Es gibt viele Datenstrukturen in Python: DataFrame, List, Series, Dict, Array,… Hier ist aus Sicht der Student*innen weniger eindeutig mehr.
  • Im Gegensatz zu R benötigt man schon am Anfang Zusatzpakete. Bei uns waren das NumPy und Pandas. In R kann ich auch die Regression noch mit der Basisversion nutzen.
  • Für jeden und jede Programmierer*in trivial, für Einsteiger*innen aber eine Hürde: Die Indizierung beginnt in Python bei 0. Solche vermeintlichen Kleinigkeiten können dazu führen, dass man Student*innen während der Vorlesung verliert.

PythonKugelpythons sind in West- und Zentralafrika heimisch - sie leben in Gras- und Strauchlandschaften. Sie sind die kleinsten unter den afrikanischen Pythons. Python ist eine moderne, objektorientierte Programmiersprache. Sie wurde von Guido van Rossum entwickelt und nach der berühmten Comedy-Truppe "Monty Pythons Flying Circus" benannt und nicht nach der - ebenfalls berühmten - Schlange. Bild: [https://unsplash.com/photos/qaErzWmbUDM Timothy Dykes]

 

Python in der Data Literacy Education

All diese Problemstellungen sind natürlich im Bereich der anekdotischen Evidenz zu verorten und es lässt sich trefflich darüber streiten. Mangels empirischer Evidenz darüber, wie denn die jeweiligen Lernerfolge auf Seiten der Studierenden hinsichtlich der verwendeten Programmiersprachen differieren, bleibt die Diskussion im Kern rein hypothetischer Natur. Empirische Befunde wären daher wünschenswert, um etwaige Dispute schnell klären zu können. Bis dahin hoffen wir, dass unsere Erfahrung sich auch anderswo bestätigt – am Ende des Tages kann man sich darauf einigen, dass es bei der Frage der gewählten Programmiersprache höchstens um inkrementelle Optimierung geht. Tolle Data Literacy Education geht natürlich sowohl mit R als auch mit Python. Aber mindestens aus akademischem Interesse würden wir als Data-Literacy-Forscher*innen gerne Daten haben, aus denen wir lesen können, womit die Studierenden besser Lernen: R oder Python?

Tags: 
Data Literacy
Python
Daten
CC-BY-SA LogoDieser Text steht unter der Lizenz Creative Commons Namensnennung - Weitergabe unter gleichen Bedingungen 4.0 International - CC BY-SA 4.0. Bitte nennen Sie bei einer möglichen Nachnutzung den angegebenen Autorennamen sowie als Quelle das Hochschulforum Digitalisierung.
  • Katharina Mahrt's blog
  • Add new comment
  • Printer-friendly version

Add new comment

(If you're a human, don't change the following field)

Your first name.

(If you're a human, don't change the following field)

Your first name.

(If you're a human, don't change the following field)

Your first name.

Switch to plain text editor

More information about text formats

Simple HTML

  • Adds captions, from the title attribute, to images with one of the following classes: image-left image-right standalone-image
  • Allowed HTML tags: <a> <em> <strong> <cite> <blockquote> <code> <ul> <ol> <li> <dl> <dt> <dd> <h2> <h3> <h4> <table> <th> <tr> <td> <span> <p> <br> <hr>
  • Lines and paragraphs break automatically.
  • Web page addresses and e-mail addresses turn into links automatically.
  • You may use [view:name=display=args] tags to display views.

Plain text

  • No HTML tags allowed.
  • Web page addresses and e-mail addresses turn into links automatically.
  • Lines and paragraphs break automatically.
Image CAPTCHA

Enter the characters shown in the image.

Alexander Silbersdorff
Alexander Silbersdorff

Dr. Alexander Silbersdorff ist promovierter Statistiker und verantwortlich für die Grundlagenausbildung für Mathematik und Statistik der wirtschaftswissenschaftlichen Fakultät der Universität Göttingen. Er ist u.a. an der vom Stifterverband und der Heinz Nixdorf Stiftung geförderten Data-Literacy-Veranstaltung Daten Lesen Lernen und dem vom BMBF geförderten Seminar Deep Learning Algorithmen – Methoden, Entwicklungen und gesellschaftliche Konsequenzen beteiligt. Darüber hinaus ist er als Forscher am Campus-Institut Data Science der Universität Göttingen aktiv.

Additional authors:
Benjamin Säfken
Dr. Benjamin Säfken

Dr. Benjamin Säfken ist promovierter Statistiker und Post-doc am Zentrum für Statistik der Universität Göttingen. Er ist u.a. an der vom Stifterverband und der Heinz Nixdorf Stiftung geförderten Data-Literacy-Veranstaltung Daten Lesen Lernen und dem vom BMBF geförderten Seminar Deep Learning Algorithmen – Methoden, Entwicklungen und gesellschaftliche Konsequenzen beteiligt.

Jana Lasser
Dr. Jana Lasser

Dr. Lasser ist promovierte Physikerin und forscht aktuell zu Themen der vernetzten und digitalen Gesundheit am Complexity Science Hub Vienna. Sie ist u.a. an der vom Stifterverband und der Heinz Nixdorf Stiftung geförderten Data-Literacy-Veranstaltung Daten Lesen Lernen aktiv.

Partners:

Stifterverband CHE Centre for Higher Education German Rectors' Conference

Project Sponsor:

Federal Ministry of Education and Research
Contact | Imprint | Privacy policy

Search form

  • Innovation Hub
    • Der Innovation Hub
    • HFDvisions
    • Studentische Zukunfts-AG #DigitalChangeMaker
    • AG Digital Accessibility
  • HFD-Sammelband
  • University:Future Festival
  • About
    • About us
    • Stakeholder Dialogue
    • Project Partners
    • Team

    • Activities of the Stifterverband
    • Activities of the Centrum für Hochschulentwicklung (CHE)
  • Network & Strategy
    • Network for Higher Education Teaching

    • Current Activities
    • HFDnet
    • SummerSchools
    • HFDcert

    • Retrospective
    • Community Working Groups
    • Online Qualifizierungsspecial
    • Netzwerktreffen 2019
    • HFDcon

    • Strategies for Higher Education in the Digital Age
    • Peer-to-peer strategy consulting
  • Students' Perspectives
    • #DigitalChangeMaker
    • Hackathon
    • Podcasting the digital turn
  • Call for Experts
  • Participate
    • How to get involved
    • Call for Experts
    • Working Groups
  • International Activities
    • Conferences & Festivals

    • Bologna Digital
    • Reinforcing European Higher Education

    • International Exchange
    • Delegation Visit to Asia
  • Publications
  • Media
    • Blog-Guidelines

  • Corona - Tools Collection
  • Corona - Special Rates for digital Tools