Statistik: Einsatzmöglichkeiten und Methoden

Lesedauer: 11 Minuten
So hilfreich ist dieser Beitrag 0
Bewertung abgeben 0 Kundenbewertungen
Statistik-Definition

Statistik wird an manchen Universitäten als eigenständiges Studienfach angeboten1, stellt aber darüber hinaus in zahlreichen Studiengängen ein Teilgebiet des Curriculums dar. Über die unterschiedlichsten Fachgebiete hinweg gilt die Vertrautheit mit statistischen Verfahren als wichtige Qualifikation2. In diesem Artikel geben wir dir einen ersten Einblick in die Bedeutung der Statistik für dein Studium.

Definition: Statistik

Eine mögliche Definition von Statistik (früher auch Sammelforschung genannt3) lautet wie folgt: methodisch-quantitative Methoden zur Einordnung und Auswertung empirischer Werte und Daten. Solange mit Zahlen, respektive Bewertungen gearbeitet wird, sind die Einsatzmöglichkeiten von statistischen Verfahren nahezu universell und erstrecken sich auf die unterschiedlichsten Bereiche (Natur-, Sozial- und Geisteswissenschaften, Technik, Medizin, Politik, Wirtschaft usw.)4. Schwerpunktmäßig sind vor allem die Bereiche Medizin, Biometrie sowie Ökonomie/Ökonometrie zu nennen, ferner auch Psychologie, Soziologie sowie viele weitere Fachgebiete2.

Vereinfacht gesagt meint Statistik die Gesamtheit aller Methoden zur Darstellung und Analyse quantitativer empirischer Daten3;5. Unabhängig vom konkreten Fachgebiet ist es also recht wahrscheinlich, dass du in deinem Studium mit diesem Thema in Berührung kommen wirst.

Relevanz und Notwendigkeit

Für Studenten sind statistische Verfahren bei der Durchführung empirisch ausgerichteter Arbeiten häufig unverzichtbar. Doch auch auf einer alltäglich-allgemeineren Ebene sind sie stark präsent (etwa in Form amtlicher Statistiken6).

Die umfassende Bedeutung der Statistik ergibt sich aus ihrer Brückenfunktion zwischen Theorie und Empirie. Sie fungiert als Hilfswissenschaft aller empirischen oder naturwissenschaftlichen Disziplinen (Medizin/medizinische Statistik; Psychologie/Psychometrie; Biologie/Biometrie usw.). Da die Menge an verfügbaren Daten rundum rasch zunimmt, ist der Stellenwert der Statistik zunehmend relevanter.3

Als wichtigste Ziele statistischer Methoden lassen sich die Entdeckung möglicher Zusammenhänge und die Überprüfung bestehender theoretischer Annahmen nennen7. Sie werden entweder zur unmittelbaren Beschreibung einer vollständigen Grundgesamtheit (Beispiel: Gesamtbevölkerung) angewendet oder um induktive Rückschlüsse auf Basis einer Teilmenge (Stichprobe) zu ziehen4.

Statistische Methoden im Überblick

Welche statistischen Verfahren du im Einzelfall anwenden solltest, hängt unter anderem von Fragestellung und Datenmaterial ab8. Grundsätzlich lässt sich zwischen statistischen Darstellungsverfahren, Kennwerten und Prüfverfahren unterscheiden7. Im Folgenden haben wir die gängigsten statistischen Techniken und Methoden für dich aufgelistet:

Statistik-Varianten-Überblick

Deskriptive Statistik vs. Inferenzstatistik

Im Folgenden wollen wir dir die Inhalte der deskriptiven Statistik einerseits und der Inferenzstatistik andererseits erläutern.
Deskriptive statistische Verfahren dienen der übersichtlichen Zusammenfassung und Aufbereitung von Daten auf der Basis von aussagekräftigen Kriterien (unter Verwendung von Häufigkeitstabellen, Kenngrößen usw.). Die Inferenzstatistik hingegen will Rückschlüsse von der Stichprobe auf die Grundgesamtheit ermöglichen (insbesondere durch Hypothesentests).7;14

Deskriptive Statistik

Durch die Methoden der deskriptiven Statistik lassen sich Daten beschreiben, nämlich in Form von Kennwerten, die sich auf Variablen (zum Beispiel Alter) beziehen6;15. Es können allerdings nur Aussagen zur Stichprobe beziehungsweise zum Datensatz getroffen werden (keine Rückschlüsse auf die Grundgesamtheit!)16. Folgende Verfahren sind der Deskriptivstatistik zuzurechnen14:

  • Modalwert (Modus)
  • Median
  • arithmetisches Mittel (Durchschnitt)
  • Varianz
  • Standardabweichung
  • Korrelationskoeffizient

Inferenzstatistik

Die Inferenzstatistik verfolgt das Ziel, aus stichprobenbezogenen Kennwerten auf die Verhältnisse in der Grundgesamtheit zu schließen17. Somit steht die Inferenzstatistik im Gegensatz zur deskriptiven Statistik. Die Inferenzstatistik basiert auf der Wahrscheinlichkeitsrechnung4und bedient sich verschiedener Verfahren der Parameterschätzung als auch der Hypothesenprüfung6:

  • Punktschätzung
  • Intervallschätzung (auch Konfidenzschätzung18)
  • Hypothesentest (zum Beispiel durch T-Test, Varianzanalyse, Regressionsanalyse usw.)

Annahmen in der Statistik

Als Annahmen bezeichnet man einerseits Hypothesen in Bezug auf Grundgesamtheiten19, andererseits aber auch bestimmte Voraussetzungen, die vor der Durchführung eines statistischen Tests geprüft werden müssen, um eine sinnvolle Interpretation zu ermöglichen20. Derartige Voraussetzungen existieren für die meisten dieser Verfahren20, darunter:

  • T-Test20
  • lineare Regression21
  • Varianzanalyse22

Statistik: Hypothesentest und Nullhypothese

Statistische Hypothesentests werden durchgeführt, um die Gültigkeit einer Hypothese zu überprüfen23.

Zu diesem Zweck formuliert man zunächst ein Hypothesenpaar, bestehend aus Alternativhypothese (vermuteter Effekt) sowie Nullhypothese (kein Effekt). Ein signifikantes Testergebnis erlaubt es dir, die Nullhypothese zu verwerfen und die Alternative abzüglich einer verbleibenden Irrtumswahrscheinlichkeit zu bestätigen. In diesem Zusammenhang wirst du auch auf die Begriffe „beidseitige“ und „einseitige“ Hypothesentests stoßen: Der Unterschied liegt darin, dass ein einseitiger Hypothesentest davon ausgeht, dass eine Abweichung von der Nullhypothese nur in eine Richtung möglich ist (besser/schlechter, positiv/negativ usw.).24

Signifikanzniveau in der Statistik

Mit dem Signifikanzniveau bezeichnet man das Ausmaß der Wahrscheinlichkeit, mit der die Nullhypothese im Rahmen eines Hypothesentests ungerechtfertigterweise verworfen wird. Das Signifikanzniveau wird in Prozent ausgedrückt (zum Beispiel 10 %, 5 %, 1 %) – je niedriger es angesetzt wird, desto deutlicher müssen die Ergebnisse ausfallen, um die Nullhypothese zu widerlegen. In statistischen Computerprogrammen wird die Signifikanz häufig durch den sogenannten P-Wert angezeigt.25

Skalenniveaus in der Statistik

Skalen ermöglichen die Zuordnung von Zahlen zu bestimmten Ereignissen oder Merkmalen und können auf unterschiedlichen Niveaus angesiedelt sein. Diese Skalenniveaus unterscheiden sich wiederum durch Zuordnungsregeln, qualitative oder quantitative Beschaffenheit sowie Informationsgehalt. Man unterscheidet in aufsteigender Reihenfolge zwischen Nominal-, Ordinal-, Intervall- sowie Verhältnisskala. Je nachdem, wie Daten skaliert sind, kommen unterschiedliche Analyseverfahren in Frage.9

Skalenniveau Merkmale Beispiel
Nominalskala Häufigkeit der Merkmale Augenfarbe
Ordinalskala Häufigkeit und Rangfolge der Merkmale Schulnoten
Intervallskala Häufigkeit, Rangfolge und Abstand der Merkmale Temperatur in Celsius
Verhältnisskala Häufigkeit, Rangfolge und Abstand der Merkmale + natürlicher Nullpunkt Alter

Statistik: Lageparameter

Lageparameter zählen zu den statistischen Kenngrößen und umfassen folgende Elemente10:

  • arithmetisches Mittel
  • Median
  • Modus

Lageparameter dienen zur möglichst repräsentativen Charakterisierung einer Verteilung im Hinblick auf ein bestimmtes Merkmal durch einen einzigen Wert. Als bekanntestes Beispiel darf der Mittelwert gelten (dieser entspricht dem arithmetischen Mittel). Durch den Median lässt sich die Verteilung eines Merkmals in zwei gleich große Hälften (50/50) teilen. Der Modus gibt jenen Wert an, der in der Verteilung am häufigsten vorkommt.10

Ebenfalls von Bedeutung ist in diesem Kontext der Standardfehler: Durch ihn wird die Streuung von Kennwerten zwischen verschiedenen gleich großen Stichproben aus derselben Population angegeben.26

Statistik: Streuungsmaße

Auch die Streuungsmaße zählen du den statistischen Kenngrößen; sie umfassen die folgenden Elemente10:

  • Varianz
  • Standardabweichung
  • Spannweite
  • Quantile
  • Quartile
  • Quartilsabstand

Durch Streuungsmaße kannst du nachvollziehen, wie sehr die einzelnen Messergebnisse um den Mittelwert streuen (Variabilität). Während die Varianz in der Praxis eher selten herangezogen wird, gilt die Standardabweichung als weitaus gebräuchlicher: Ein kleiner Wert zeugt von einer eng an den Mittelwert angelehnten Streuung, ein hoher von starken Abweichungen. Die Spannbreite ergibt sich aus den beiden Extremwerten einer Verteilung.10

Statistik: Zusammenhangsmaße

Zusammenhangsmaße dienen der Analyse von Zusammenhängen zwischen zwei oder mehreren Variablen12. Man unterscheidet unter anderem folgende Varianten12:

  • Korrelationskoeffizient r nach Pearson
  • einfache lineare Regression
  • Rangkorrelationskoeffizient rs nach Spearman
  • Pearson Chi-Quadrat-Test (Koeffizienten Phi, Kontingenzkoeffizient und Cramers V)
  • multiple Regression
  • logistische Regression

Je nach Skalenniveau und Anzahl der Variablen kommen verschiedene Verfahren und Zusammenhangsmaße in Frage. Der Pearson Chi-Quadrat-Test kann zum Beispiel eingesetzt werden, wenn die betreffenden Variablen nominal- bis ordinalskaliert sind. Hierbei lassen sich verschiedene Koeffizienten berechnen, wobei Cramers V am häufigsten vorkommt (als Alternativen stehen Phi und der Kontingenzkoeffizient zur Verfügung). Als bekanntestes Zusammenhangsmaß darf wohl der Korrelationskoeffizient r nach Pearson gelten, welcher der standardisierten Kovarianz entspricht.12

Weitere Statistik-Methoden

Abseits der bereits genannten Beispiele gibt es zahlreiche weitere wichtige Statistik-Begriffe und -methoden, auf die auch im Studium häufig Bezug genommen wird:

  • T-Test
    • Bei Untersuchungen auf Mittelwertunterschiede kannst du den T-Test zur Anwendung bringen.11 Konkret geht es darum, ob diese Unterschiede zufälliger Natur oder statistisch signifikant sind27.
  • Normalverteilung
    • Bei Normalverteilungen handelt es sich um theoretische Verteilungen in Form der „Gauß’schen Glockenkurve“, die bei vielen Analyseverfahren als Voraussetzung vorliegen müssen. Durch Standardisierung können Normalverteilungen in eine Standardnormalverteilung umgewandelt werden, was für verschiedene Verfahren und Variablenvergleiche ebenfalls notwendig ist.28
  • Standardnormalverteilung
    • Die Standardnormalverteilung ist eine spezielle Art der Normalverteilung, bei der der Erwartungswert bei 0 liegt und die Standardabweichung bei 1.
  • Cronbachs Alpha
    • Cronbachs Alpha leistet dir gute Dienste als Reliabilitätsmaß, wenn du beispielsweise die interne Konsistenz einer Skala oder eines Tests überprüfen möchtest29.
  • Regressionsanalyse
    • Die Regressionsanalyse als Instrument der Statistik im allgemeinsten Sinn wird genutzt, um die Ausprägungen einer unabhängigen Variable (Y) mithilfe von abhängigen Variablen (X) vorherzusagen30.
  • Anova (Varianzanalyse)
    • Die Varianzanalyse (ANOVA) kommt anstelle des T-Tests zum Einsatz, wenn über mehr als zwei Stichproben hinweg Mittelwerte verglichen werden sollen.31
  • Faktoranalyse
    • Die Faktoranalyse dient dazu aus der Vielzahl an Variablen die latenten Variablen herauszuarbeiten.

Ergebnisse aus der Statistik richtig formulieren

Wenn du im Rahmen deines Studiums mit statistischen Verfahren arbeitest, gilt es diese nicht nur richtig einzusetzen, sondern die Ergebnisse auch in korrekter Form auszuformulieren. Spezifische Vorgaben existieren unter anderem für die Verwendung von Zeichen, die Angabe von Zahlen oder die Ausformulierung von Kennwerten. Hierbei kannst du dich beispielsweise an den geltenden APA-Richtlinien orientieren32.

Tipps für die Statistik Klausur

Statistikklausuren sorgen unter Studenten für gemischte Gefühle – manch einer tut sich mit dem Format schwer, andere wiederum sehen darin ein persönliches Steckenpferd. Unabhängig von deiner persönlichen Affinität zur Materie ist mit sorgfältiger Vorbereitung viel gewonnen. Hierzu wollen wir dir abschließend einige Ratschläge mitgeben:

  • recherchiere im Internet nach Altklausuren33;34 deiner Universität und übe mit diesen
  • lerne statistische Formeln nicht nur auswendig, sondern stelle sicher, dass du auch sattelfest bei der Anwendung bist
  • mach dich mit den wichtigsten Grundbegriffen vertraut (Mittelwert, Verteilung, Streuung usw.)
  • tausche dich mit anderen Prüfungskandidaten aus und gründe Lerngruppen

Häufig gestellte Fragen

Unter Statistik versteht man das wissenschaftliche Vorgehen zur zahlenmäßigen Erfassung, Untersuchung und Auswertung von Daten. Außerdem werden auch die Ergebnisse statistischer Analysen mit diesem Begriff bezeichnet.4

Das Einsatzgebiet von statistischen Verfahren ist universell. Sie werden beispielsweise im Rahmen von empirischen Erhebungen, Experimenten oder mathematischen Forschungen durchgeführt.2

Auch in dieser Hinsicht gilt: Statistik kann universell eingesetzt werden. In welchen Fachgebieten sie eine besonders prominente Rolle einnimmt, erfährst du im Beitrag.

Bei statistischen Verfahren handelt es sich um methodische Instrumente quantitativer Natur, die zum Zwecke des empirischen Erkenntnisgewinns auf Massenphänomene angewandt werden.4

Im Gegenteil: Statistische Verfahren haben sich längst auch abseits der Mathematik und der Naturwissenschaft als Bestandteil des methodischen Repertoires etabliert (Details im Beitrag).

Quellen

Universität Wien: Statistik (Bachelor), in: Universität Wien, o.D., [online] https://studieren.univie.ac.at/studienangebot/bachelor-und-diplomstudien/statistik-bachelor/ (10.08.2022)

2 Universität Bielefeld: Zentrum für Statistik, in: Universität Bielefeld, o.D., [online] https://www.uni-bielefeld.de/einrichtungen/zest/ (10.08.2022)

3 DBpedia: About: Statistik, in: DBpedia.de, o.D., [online] http://de.dbpedia.org/page/Statistik (10.08.2022)

4 Kamps, Udo: Statistik, in: Gabler Wirtschaftslexikon, o.D., [online] https://wirtschaftslexikon.gabler.de/definition/statistik-45267 (10.08.2022)

5 Döring, Nicola: Statistik, in: Dorsch Lexikon der Psychologie, 05.05.2019, [online] https://dorsch.hogrefe.com/stichwort/statistik#search=4dd8035537b42447214434f3ccdb4a7b&offset=2 (10.08.2022)

6 Duden: Statistik, in: Duden, o.D., [online] https://www.duden.de/rechtschreibung/Statistik (10.08.2022)

7 Bedenbecker, Christoph: Forschungsmethodik: Grundbegriffe der Statistik, in: Universität Innsbruck, 2004, [online] https://www.uibk.ac.at/iezw/mitarbeiterinnen/senior-lecturer/bernd_lederer/downloads/forschungsmethodik_statistik_bedenbecker.pdf (10.08.2022)

8 Universität Leipzig: Statistische Auswertung, in: Universität Leipzig Methodenportal, o.D., [online] https://home.uni-leipzig.de/methodenportal/statistische_auswertung/ (10.08.2022)

9 Universität Leipzig: Skalenniveaus, in: Universität Leipzig Methodenportal, o.D., [online] https://home.uni-leipzig.de/methodenportal/skalenniveaus/ (10.08.2022)

10 Universität Leipzig: Kenngrößen, in: Universität Leipzig Methodenportal, o.D., [online] https://home.uni-leipzig.de/methodenportal/deskriptive-statistik/ (10.08.2022)

11 Universität Leipzig: Unterschiede, in: Universität Leipzig Methodenportal, o.D., [online] https://home.uni-leipzig.de/methodenportal/unterschiede-2/ (10.08.2022)

12 Universität Leipzig: Zusammenhänge, in: Universität Leipzig Methodenportal, o.D., [online] https://home.uni-leipzig.de/methodenportal/zusammenhaenge/ (10.08.2022)

13 Universität Leipzig: Faktoranalyse, in: Universität Leipzig Methodenportal, o.D., [online] https://home.uni-leipzig.de/methodenportal/faktoranalyse/ (10.08.2022)

14 Lederer, Bernd: Quantitative Auswertungsmethoden, in: Universität Innsbruck, o.D., [online] https://www.uibk.ac.at/iezw/mitarbeiterinnen/senior-lecturer/bernd_lederer/downloads/quantitative-auswertungsmethoden_201412.pdf (10.08.2022)

15 Häcker, Hartmut O.: Deskriptivstatistik, in: Dorsch Lexikon der Psychologie, 06.05.2019, [online] https://dorsch.hogrefe.com/stichwort/deskriptivstatistik (10.08.2022)

16 Statista: Definition Deskriptive Statistik, in: Statista, o.D., [online] https://de.statista.com/statistik/lexikon/definition/49/deskriptive_statistik/#:~:text=Deskriptive%20statistische%20Parameter%20beschreiben%20bei,der%20induktiven%20Statistik%20zum%20Einsatz. (10.08.2022)

17Dorsch: Inferenzstatistik, in: Dorsch Lexikon der Psychologie, 14.06.2016, [online] https://dorsch.hogrefe.com/stichwort/inferenzstatistik (10.08.2022)

18 Kamps, Udo: Inferenzstatistik, in: Gabler Wirtschaftslexikon, o.D., [online] https://wirtschaftslexikon.gabler.de/definition/inferenzstatistik-40284 (10.08.2022)

19 Technische Universität Wien: Statistische Tests, in: Technische Universität Wien, o.D., [online] http://www.algebra.tuwien.ac.at/tm/Stat_2.pdf (10.08.2022)

20 StatistikGuru: Gepaarter t-Test in SPSS: Voraussetzungen und Annahmen, in: StatistikGuru, o.D., [online] https://statistikguru.de/spss/gepaarter-t-test/voraussetzungen-und-annahmen.html (10.08.2022)

21 Technische Universität Dresden: Modellannahmen der linearen Regression, in: Technische Universität Dresden, o.D., [online] https://tu-dresden.de/gsw/phil/iso/mes/ressourcen/dateien/prof/lehre/Forschs/Referate/regression_R6.pdf?lang=de (10.08.2022)

22 StatistikGuru: Einfaktorielle ANOVA: Voraussetzungen, in: StatistikGuru, o.D., [online] https://statistikguru.de/spss/einfaktorielle-anova/voraussetzungen-5.html (10.08.2022)

23 Medistat: Statistischer Hypothesentest, in: Medistat Medizinische Statistik, o.D., [online] https://www.medistat.de/glossar/prinzip-statistischer-hypothesentests/statistischer-hypothesentest/ (10.08.2022)

24 Medistat: Nullhypothese, in: Medistat Medizinische Statistik, o.D., [online] https://www.medistat.de/glossar/prinzip-statistischer-hypothesentests/nullhypothese/ (10.08.2022)

25 Universität Köln: Signifikanzniveau (Irrtumswahrscheinlichkeit), in: Universität Köln, o.D., [online] http://eswf.uni-koeln.de/glossar/node151.html (10.08.2022)

26 Bergmann, Bärbel: Standardfehler, in: Technische Universität Dresden, o.D., [online] https://versuch.file2.wcms.tu-dresden.de/w/index.php/Standardfehler#:~:text=Der%20Stichprobenfehler%20oder%20Standardfehler%20bezeichnet,einem%20gegebenen%20Stichprobenumfang%20sein%20k%C3%B6nnen. (10.08.2022)

27 Kappelhoff: T-Test, in: Bergische Universität Wuppertal, o.D., [online] https://temme.wiwi.uni-wuppertal.de/fileadmin/kappelhoff/Downloads/Vorlesung/t-test.pdf (10.08.2022)

28 Universität Zürich: Deskriptive, univariate Analyse (Verteilungen), in: Universität Zürich, o.D., [online] https://www.methodenberatung.uzh.ch/de/datenanalyse_spss/deskuniv.html (10.08.2022)

29 Hossiep, Rüdiger: Cronbachs Alpha, in: Dorsch Lexikon der Psychologie, 28.04.2021, [online] https://dorsch.hogrefe.com/stichwort/cronbachs-alpha (10.08.2022)

30 Universität Köln: Regressionsanalyse, in: Universität Köln, o.D., [online] http://eswf.uni-koeln.de/glossar/node99.html (10.08.2022)

31 Hain, Johannes: Varianzanalyse, in: Universität Wüzburg, o.D., [online] https://www.uni-wuerzburg.de/fileadmin/10040800/user_upload/hain/SPSS/ANOVA.pdf (10.08.2022)

32 Schott, Nadja: Angabe statistischer Werte nach APA-Richtlinien, in: Universität Stuttgart, o.D., [online] https://www.inspo.uni-stuttgart.de/institut/aii/dokumente/Angabe_statistischer_Werte_und_Literatur.pdf (10.08.2022)

33 Friedrich-Alexander-Universität Lehrstuhl für Statistik und Ökonometrie: Altklausuren zu Statistikgrundlagen, in: Friedrich-Alexander-Universität, o.D., [online] https://www.statistik.rw.fau.de/klausuren/ (10.08.2022)

34 Martin-Luther-Universität Halle-Wittenberg: Statistik 1, in: Martin-Luther-Universität Halle-Wittenberg, 20.01.2022, [online] https://statistik.wiwi.uni-halle.de/lehre/203701_3339407/ (10.08.2022)