Grundlagen: Daten, Messen, Skalenniveaus

_Statistik

Prof. Dr. Armin Eichinger

TH Deggendorf

06.10.2025

Motivation

Wirtschaftspsychologie, Bioinformatik

Wirtschaftspsychologie

1. Grundlagen für wissenschaftliches Denken

  • Statistik ist die Sprache der empirischen Forschung.

  • Ohne statistische Kenntnisse kann man Daten nicht korrekt interpretieren oder die Qualität von Studien einschätzen.

  • Sie fördert kritisches Denken: Welche Schlüsse sind wirklich gerechtfertigt, welche nicht?

2. Praxisrelevanz in der Wirtschaftspsychologie

  • Personalpsychologie & HR: Diagnostik, Eignungstests, Mitarbeiterbefragungen → Validität, Reliabilität, Signifikanz.
  • Marktforschung & Konsumentenpsychologie: Kundenumfragen, Experimente zu Werbewirkung, A/B-Tests → Entscheidungen stützen sich auf statistische Evidenz.
  • Arbeitspsychologie & Organisationsentwicklung: Mitarbeiterzufriedenheit, Belastungsmessung, Evaluation von Interventionen.

3. Berufliche Kompetenz & Glaubwürdigkeit

  • Wirtschaftspsycholog:innen werden oft mit Daten konfrontiert (KPIs, Befragungsergebnisse, Analytics).
  • Statistikkenntnisse machen den Unterschied zwischen bloßer Zahlenpräsentation und valider Interpretation.
  • Sie erhöhen die Glaubwürdigkeit gegenüber Stakeholdern, weil man Effekte, Unsicherheiten und Limitationen benennen kann.

4. Entscheidungsfindung im digitalen Zeitalter

  • Datafizierung und KI-gestützte Analysen sind allgegenwärtig.
  • Statistik liefert das Fundament, um Chancen und Grenzen datenbasierter Systeme zu verstehen.
  • Nur wer Statistik versteht, kann Daten kritisch reflektieren und Missinterpretationen vermeiden.

👉 Kurzform: Statistik ist für Wirtschaftspsycholog:innen wie Anatomie für Mediziner:innen: unverzichtbares Handwerkszeug, um Befunde zu verstehen, Interventionen zu bewerten und fundierte Entscheidungen zu treffen.

Bioinformatik

1. Grundlagen für wissenschaftliches Denken

  • Statistik ist die Sprache der empirischen Wissenschaft – auch in den Lebenswissenschaften.
  • Ohne statistische Kenntnisse können bioinformatische Daten nicht korrekt ausgewertet oder Forschungsergebnisse kritisch hinterfragt werden.
  • Statistik fördert kritisches Denken: Welche Unterschiede in biologischen Daten sind echt, welche bloßer Zufall?

2. Praxisrelevanz in der Bioinformatik

Genomik & Transkriptomik: Hochdurchsatzverfahren (z. B. RNA-Seq, DNA-Methylierung) erzeugen riesige Datenmengen → Signifikanztests, multiple Testkorrektur, Normalisierung sind unerlässlich. - Struktur- & Systembiologie: Korrelationen, Clusteranalysen, Netzwerkanalysen beruhen auf statistischen Konzepten. - Medizinische Bioinformatik: Personalisierte Medizin, Diagnostik, Risikomodelle → Vorhersagekraft und Fehlerwahrscheinlichkeiten müssen verstanden und quantifiziert werden.

3. Berufliche Kompetenz & Glaubwürdigkeit

  • Bioinformatiker:innen arbeiten an der Schnittstelle von Informatik, Biologie und Medizin – mit der Verantwortung, valide Aussagen über lebende Systeme zu treffen.
  • Statistikkenntnisse entscheiden über die Qualität der Analysen – und damit über die Akzeptanz gegenüber Biolog:innen, Mediziner:innen und Industriepartnern.
  • Wer Modelle baut oder Publikationen verfasst, muss Effekte, Unsicherheiten und Limitationen klar benennen können.

4. Entscheidungsfindung im datengetriebenen Zeitalter - Biowissenschaftliche Forschung wird zunehmend automatisiert, KI-gestützt und datenzentriert. - Statistik liefert das Fundament für Machine Learning, Datenvorverarbeitung, Modellvalidierung und Ergebnisinterpretation. - Nur wer Statistik versteht, kann Blackbox-Modelle kritisch reflektieren, ihre Aussagekraft einschätzen – und verantwortungsvoll nutzen.

👉 Kurzform:

Statistik ist für Bioinformatiker:innen wie Physik für Ingenieur:innen: unverzichtbares Werkzeug, um biologische Daten zu verstehen, valide Modelle zu bauen und fundierte wissenschaftliche Beiträge zu leisten.

Begriffe

Daten

  • Abgrenzung zu Daten(typen) in der Informatik:
    • “Peter Meier” ist vom Datentyp Zeichenkette
    • 17 ist vom Datentyp Integer
    • 13.456 …
  • Daten stehen in einem Bezug zu einem Gegenstandsbereich
  • Daten entstehen aus Beobachtung, Messung, …
  • Daten sind eine mögliche Art der Abstraktion; sie bilden einen Aspekt des Gegenstandsbereichs ab
  • Zwischen Gegenstandsbereich und Daten besteht eine Übereinstimmung (Entsprechung, Kongruenz) hinsichtlich dieses Aspekts
  • Daten haben damit eine Bedeutung
  • Nach diesem Verständnis: Daten = Informationen
  • Für unsere Zwecke überwiegend numerische Daten

Variable, Konstrukte

  • Variable: Merkmal oder Eigenschaft eines Merkmalsträgers (z. B. Mensch) mit mind. zwei Ausprägungen
  • Konstrukt: Variablen, die nicht direkt beobachtbar ist; z. B. Intelligenz, Einstellung
  • Latente Variable: Häufig synonym für Konstrukt
  • Manifeste Variable: Beobachtbare, direkt messbare Variable
  • Daten sind die Ausprägungen von manifesten Variablen
  • Herausforderungen: Finden von manifesten Variablen, die die latenten Variablen (Konstrukte) gut repräsentieren ( → Operationalisierung)

Operationalisierung

  • Operationalisierung: Umsetzung eines theoretischen Merkmals (= Konstrukt = latente Variable) in eine beobachtbare bzw. direkt messbare (manifeste) Variable
  • Annahme: Latente Variable als Ursache der manifesten Variablen (= Indikator)
  • Die Art der Operationalisierung entscheidet über das Skalierungs- o. Skalenniveau der Variablen (Qualität der Messung mit Meterstab vs. Längenschätzung)
  • Beispiele:
    • Anzahl der Geschwister
    • Gewicht
    • Lebenszufriedenheit
    • Politische Orientierung
    • Konzentrationsfähigkeit
    • Intelligenz

Messen

  • Messen ist die Zuordnung von Zahlen zu Merkmalsausprägungen von Objekten nach festgelegten Regeln
  • Kernaspekt:
    • strukturtreue (= homomorphe) Abbildung empirisch → numerisch
    • Die Struktur der empirischen und der numerischen Seite sollen möglichst übereinstimmen
  • Unterschied physikalische Messung (PM) – sozialwissenschaftliche Messung (SM)
    • PM: Operationalisierung steckt im Messgerät; 1:1-Beziehung zwischen latenter und manifester Variablen (= Messgerät)
    • SM: Güte der Operationalisierung muss argumentiert werden
  • Gemeinsamkeit: Güte der numerischen Zuordnung muss argumentiert werden (vgl. Skalenniveaus)

Skalenniveaus

Nominalskala

  • Eine Nominalskala ordnet den Merkmalsausprägungen Zahlen so zu, dass gleiche Merkmalsausprägungen gleiche Zahlen und unterschiedliche Merkmalsausprägungen verschiedene Zahlen erhalten.
  • Die Struktur, die erhalten werden muss, ist die Äquivalenz bzw. Unterscheidbarkeit der Elemente auf der empirischen Seite.
  • Zahlen entsprechen Namen
  • Jede eindeutige Transformation der zugeordneten Zahlen ist erlaubt.
  • „Qualitative Variable”
  • Zweistufige (meist nominale) Variable: dichotom, binär
  • Mittelwerte sind sinnlos, da alle Zahlenzuordnungen erlaubt sind, die die Eindeutigkeit erhalten.
  • Beispiele: Geschlecht, Rückennummern von Sportlern, Händigkeit

Ordinalskala

  • Eine Ordinalskala ordnet den Merkmalsausprägungen Zahlen so zu, dass die größeren Merkmalsausprägung die größere Zahl erhält.

  • Die Struktur, die erhalten werden muss, ist die Rangreihe der Elemente auf der empirischen Seite. Dabei muss auch die Gleichheit festgelegt werden können.

  • Jede Transformation, die diese Rangreihe in den zugeordneten Zahlen erhält, ist erlaubt: monotone Transformationen.

  • Mittelwerte sind sinnlos, da alle Zahlenzuordnungen erlaubt sind, die die Reihenfolge erhalten

  • Beispiele: Position in einer Unternehmenshierarchie, Offiziersränge, Schulabschlüsse, Härtegrade

Intervallskala

  • Eine Intervallskala ordnet Merkmalsausprägungen Zahlen so zu, dass die Rangordnung der Zahlendifferenzen zwischen je zwei Merkmalsausprägungen der Rangordnung der Merkmalsunterschiede zwischen je zwei Objekten entspricht.
  • Die Struktur, die erhalten werden muss, sind die Abstände zwischen den Elementen auf der empirischen Seite.
  • Erlaubt sind lineare Transformationen:
    z. B. Fahrenheit = 1.8 × Celsius + 32
  • Eine Intervallskala hat keinen natürlichen Nullpunkt.
  • Mit Intervallskalendaten können sinnvoll Differenzen, Summen und Mittelwerte berechnet werden.
  • Beispiele: Ratingskalen, viele psychologischen Messverfahren (IQ-Test)

Verhältnisskala

  • Eine Verhältnisskala ordnet Merkmalsausprägungen Zahlen so zu, dass das Verhältnis zwischen je zwei Zahlen dem Verhältnis der Merkmalsausprägungen entspricht.
  • Die Struktur, die erhalten werden muss, ist das Verhältnis der Merkmalsausprägungen der Elemente auf der empirischen Seite.
  • Empirische Verknüpfung ≙ numerische Addition
  • Erlaubt sind multiplikative Transformationen (= Ähnlichkeitstrafo.) der Art Y = k × X; z.B. Umrechnung m → cm; cm → inch
  • Eine Verhältnisskala hat einen natürlichen Nullpunkt
  • Beispiele: viele physikalische Messverfahren

Absolutskala

  • Eine besondere Form der Verhältnisskala
  • Maßeinheit ist natürlich gegeben; meist „Stück”
    → kann nicht frei gewählt werden;
    → keine Transformationen möglich
  • Beispiele: Pulsschläge pro Minute; Anzahl Menschen in einem Raum

Anwendung

Lebenszufriedenheit von Kindern

Lebenszufriedenheit (2)