Willkommen zum Kurs & Werkzeugkiste

rstatsZH - Data Science mitR

Lars Schöbitz

Sep 23, 2025

Willkommen! 👋

Triff die Kursleitung

Lars Schöbitz

Headshot of Lars Schöbitz

Lernziele des Kurses

Die folgenden übergeordneten Lernziele sind für diesen Kurs definiert:

  1. Datenwissenschaftliche Werkzeuge beherrschen - (R, RStudio IDE, Git, GitHub, tidyverse, Quarto) verwenden, um Daten effektiv zu analysieren und zu kommunizieren.
  1. Reproduzierbare Dokumente erstellen - Professionelle Berichte mit Quarto erstellen, einschliesslich Querverweisen, Abbildungen und Tabellen.
  1. Open Source Government praktizieren - Daten und Code offen teilen und dabei Best Practices für Reproduzierbarkeit und Zusammenarbeit befolgen.
  1. Ein Portfolio aufbauen - Praxisnahe Projekte abschliessen, die deine Fähigkeiten demonstrieren.

Du bist dran: Über Dich

  • Wähle einen Gegenstand aus und mache dir eine Minute lang Notizen.
  • Was hat der Gegenstand, den du ausgewählt hast, mit dem Grund zu tun, warum du hier bist?
01:00

In Paaren

Nehmt euch jeweils 2 Minuten Zeit, um euch auszutauschen:

  • Was hat der Gegenstand, den ihr ausgewählt habt, mit dem Grund eurer Anwesenheit zu tun?
05:00

Kurskalendar

readr::read_csv("../data/tbl-00-rstatszh-kursplan.csv") |> 
  dplyr::select(modul, datum, titel) |> 
  dplyr::mutate(datum = format(datum, format = "%d %B %Y")) |> 
  knitr::kable()
Rows: 13 Columns: 5
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr  (3): titel, modul, link
dbl  (1): woche
dttm (1): datum

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
modul datum titel
Modul 01 23 September 2025 Willkommen zum Kurs & Werkzeugkiste & Kollaboratives Arbeiten mit GitHub I
Modul 02 30 September 2025 Explorative Datenanalyse durch Visualisierung & Digitaler Arbeitsplatz (DAP) & R-Community
Modul 03 07 Oktober 2025 Daten Transformation mit dplyr
Modul 04 14 Oktober 2025 Daten Import & Daten Management & Kollaboratives Arbeiten mit GitHub II
Modul 05 21 Oktober 2025 Bedingte Anweisungen & Datumswerte & OGD Ressourcen
Modul 06 28 Oktober 2025 Daten Typen & Vektoren & Iteration I (for loops)
Modul 07 04 November 2025 Datenformen lang und breit & Daten zusammenfügen
Modul 08 11 November 2025 Mit Text Daten arbeiten & KTZH Corporate Design mit statR
Modul 09 18 November 2025 Erstellung von Berichten und Folien mit Quarto
Modul 10 25 November 2025 Funktionen schreiben & Parameterisierung von Berichten
Abschlussprojekt 02 Dezember 2025 Arbeitszeit für Abschlussprojekt
Abschlussprojekt 09 Dezember 2025 Abgabe Abschlussprojekt
Abschlussveranstaltung 16 Dezember 2025 Abschlussveranstaltung

Kursstruktur

  • Ich bin dran: Vortragssegmente + Live-Coding
  • Wir sind dran: Live-Coding + Mitmachen
  • Ihr seid dran: Übungen in Paaren

Ich bin dran: Vortragssegmente + Live-Coding

  • Der Kursleiter schreibt und spricht den Code laut vor
  • Der Kursleiter erklärt Konzepte und Prinzipien, die relevant sind
  • Code wird auf dem Bildschirm angezeigt

Wir sind dran: Live-Coding + Mitmachen

  • Der Kursleiter schreibt und spricht den Code laut vor
  • Der Kursleiter erklärt relevante Konzepte und Prinzipien
  • Der Code wird auf dem Bildschirm angezeigt
  • Die Lernenden machen mit, indem sie denselben Code schreiben und ausführen

Ihr seid dran: Übungen in Paaren

  • Zwei Lernende arbeiten in Paaren in Break-out Räumen zusammen
  • Eine Person tippt und teilt die Bildschirmanzeige
  • Eine Person bietet Kommentare und Vorschläge an, und tippt selbst auch mit

Unterstützung bekommen / Fragen stellen

  • Während Live-Coding: hebt die Hand mittels Zoom und unterbrecht mich. Ich werde versuchen, mich um dein Anliegen zu kümmern, wenn es die Zeit erlaubt. Offene Fragen werden dokumentiert.

  • Während Übungen in Break-out Räumen: Ihr könnt mich zu euch rufen. Bei einem Grossteil der Übungen werde ich versuchen in jedem Raum einmal vorbeizuschauen.

Verhaltenskodex

Website zum Kurs

rstatszh-k011.github.io/website/

Lernziele (für diese Woche)

lernziele <- readr::read_csv(here::here("data/tbl-01-rstatszh-lernziele.csv")) |> 
  dplyr::filter(modul == params$modul) |>
  dplyr::pull(lernziele)
Rows: 36 Columns: 4
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr  (2): titel, lernziele
dbl  (1): modul
dttm (1): datum

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
  1. Die Lernenden können ein GitHub Issue öffnen und den Kursleiter markieren.
  2. Die Lernenden können ein Repository von GitHub klonen und das GitHub PAT verwenden, um einen Commit von ihrem lokalen Repository auf GitHub zu übertragen.
  3. Die Lernenden können vier Komponenten einer Quarto-Datei identifizieren (YAML, Code Chunk, R-Code, Markdown).
  4. Die Lernenden können die vier Fenster der RStudio IDE identifizieren.

Posit Cloud & RStudio IDE

-

-

-

-

-

-

Bildschirm Setup - Frage

1: Ein Bildschirm

2: Zwei oder mehr Bildschirme

Was ist Quarto?

Quarto …

  • ist ein neues, open-source, wissenschaftliches und technisches Publikationssystem
  • zielt darauf ab, den Prozess der Erstellung von Berichten und der Zusammenarbeit drastisch zu verbessern
A schematic representing the multi-language input (e.g. Python, R, Observable, Julia) and multi-format output (e.g. PDF, html, Word documents, and more) versatility of Quarto.

Artwork from “Hello, Quarto” keynote by Julia Lowndes and Mine Çetinkaya-Rundel, presented at RStudio Conference 2022. Illustrated by Allison Horst.

Ich bin dran: Ein Rundgang durch RStudio IDE und Quarto



Zurücklehnen und genießen!

Pause machen

Bitte steh auf und beweg dich.

countdown(minutes = 10)
10:00

Ihr seid dran: md-01-uebungen

  1. Öffne posit.cloud/spaces/643775 in deinem Browser.
  2. Falls du dich nicht im rstatsZH-K011 Arbeitsbereich befindest, öffne diesen.
  3. Klicke auf Start neben md-01-exercises.
  4. Suche im Dateimanager im Fenster unten rechts die Datei hello-quarto.qmd und klicke darauf.
  5. Klicke auf den Render-Button um das Dokument zu rendern. Möglicherweise musst du Pop-ups erlauben in deinem Browser.
  6. Im YAML-Header, ersetze beim Schlüssel author: den Text Your Name mit deinem Namen.
  7. Rendere das Dokument erneut.
  8. Untersuche die Komponenten des Dokuments und führe eine weitere Aktualisierung durch und rendere erneut.
  9. Besprich deine Notizen über die vorgenommenen Aktualisierungen mit deinen Raumpartner:innen.
15:00

Von deiner eigenen Arbeitsumgebung aus

A screenshot of a Quarto document rendered inside RStudio

A screenshot of a Quarto document rendered inside JupyterLab

A screenshot of a Quarto document rendered inside VSCode

Quarto formate

Mit einer Installation ist alles enthalten

  • RMarkdown entwickelte sich zu einem großen Ökosystem mit unterschiedlicher Syntax.

  • Quarto kommt mit allem was es braucht um verschiedene Formate zu erstellen.

    • HTML Berichte und Webseiten
    • PDF Berichte
    • MS Office (Word, Powerpoint)
    • Präsentationen (Powerpoint, Beamer, revealjs)
    • Bücher
  • Jede Programmiersprache, exakt gleiche Vorgehensweise und Syntax

Viele Quarto Formate

Feature R Markdown Quarto
Basic Formats

html_document

pdf_document

word_document

html

pdf

docx

Beamer beamer_presentation beamer
PowerPoint powerpoint_presentation pptx
HTML Slides

xaringan

ioslides

revealjs

revealjs
Advanced Layout

tufte

distill

Quarto Article Layout

Viele Quarto Formate

Feature R Markdown Quarto
Cross References

html_document2

pdf_document2

word_document2

Quarto Crossrefs
Websites & Blogs

blogdown

distill

Quarto Websites

Quarto Blogs

Books bookdown Quarto Books
Interactivity Shiny Documents Quarto Interactive Documents
Journal Articles rticles Journal Articles
Dashboards flexdashboard Quarto Dashboards

Versionskontrolle

Versionskontrolle mit Git und GitHub

Eine Möglichkeit, Dateien mit anderen zu teilen, damit sie:

  • Dateien herunterladen,
  • wiederverwenden,
  • Etwas beitragen können.

Du kannst den Verlauf von Dateien anzeigen und zu jedem beliebigen Zeitpunkt zu einer früheren Version zurückgehen.

Warum ist es nützlich?

Git und GitHub

  • Git ist eine Software zur Versionskontrolle
  • Erstellt im Jahr 2005
  • Beliebt bei Programmierern, die gemeinsam Code entwickeln
  • Verfolgt Änderungen in einer Gruppe von Dateien (Verzeichnis/Ordner/Repository)

  • GitHub is a hosting platform for version control using Git

  • Launched in 2008, aquired by Microsoft in in 2018, Microsoft for US$ 7.5 billion

  • 100 million Users (20.5 in 2022 alone) (October, 2023)

  • Social media for software developers

Ich bin dran: Ein Rundgang durch GitHub

Zurücklehnen und genießen!

Pause machen

Bitte steh auf und beweg dich.

countdown(minutes = 5)
05:00

Ihr seid dran: Klone ein Repository von GitHub

  1. Öffne einen Webbrowser auf deinem Laptop.
  2. Gehe zur Website des Kurses: rstatszh-k011.github.io/website/
  3. Klicke im Menü auf der linken Seite auf Modul 1
  4. In der Modulübersicht, scrolle nach unten zur Sektion “Zusatzaufgaben” und öffne “Zusatzaufgabe 1: Git configuration”
  5. Folge den Anweisungen auf der Website, um das Repository von GitHub zu klonen.
15:00

Zusatzaufgaben Modul 1

Modul 1 Dokumentation

Danke!

Danke! 🌻

Folien erstellt mit revealjs und Quarto: https://quarto.org/docs/presentations/revealjs/

Access slides als PDF auf GitHub

Alle Materialien sind lizenziert unter Creative Commons Attribution Share Alike 4.0 International.