• Zielgruppen
  • Suche
 

Statistische Beratung

Biostatistische Beratung


Das Institut für Biostatistik bietet Studenten und Mitarbeitern der Naturwissenschaftlichen Fakultät statistische Beratung an. Um die Beratung so effektiv wie möglich zu gestalten, bitten wir vorab um einige Informationen. Bitte schreiben Sie eine E-Mail an Prof. Hothorn und erläutern kurz Ihr Anliegen, wir melden uns dann bei Ihnen. Die Mail sollte folgende Punkte enthalten:

  • Name, Mailadresse, Telefonnummer, Institut

  • eine präzise Versuchsbeschreibung:

    • Was ist der Anlass bzw. das Ziel des Versuchs?

    • Wie sah der Versuch aus (Versuchseinheiten, Randomisierung, …)?

    • Was sind die Zielgrößen und was die Einflussgrößen (Faktoren, Kovariablen)?

    • Welche Fragestellungen/Hypothesen sollen hauptsächlich untersucht werden?

    • Gibt es daneben noch weitere Fragestellungen/Hypothesen, die von Interesse sind?

  • einen Datensatz:

    • als Anhang in einem der üblichen Dateiformate (txt, csv, …)

    • im flat file format (d.h. jede Zeile enthält eine einzelne Beobachtung, und alle Variablen sind spaltenweise angeordnet)


Was wir anbieten:


  • Diskussion Ihres Versuchsdesigns und Ihrer Fragen, Empfehlung statistischer Methoden

  • Auswertung Ihrer Daten anhand von einem Beispiel mit R (nur in Spezialfällen mit SAS)

  • Beschreibung und Erklärung der verwendeten statistischen Verfahren, Interpretation der Ergebnisse, (falls gewünscht) Angabe von Referenzen


Was wir nicht anbieten:


  • Beratung ohne vorher einen Termin per E-Mail abgesprochen zu haben

  • Auswertung all Ihrer Datensätze, besonders dann nicht, wenn die Vorgehensweise für jeden Datensatz genau dieselbe ist

  • Fehlerbehebung in Excel, SigmaPlot, Minitab, Matlab, Stata, SPSS, Statistica, …


Versuchsdesign


Wir raten dringend dazu, einen ersten Beratungstermin vor Beginn der Studie oder des Versuchs auszumachen, um die statistischen Aspekte der Versuchsplanung zu besprechen. Die randomisierte Wiederholung der Behandlungen von Interesse (in Versuchsanlagen) bzw. ein durchdachter Plan um zufällige Stichproben zu erhalten (in Beobachtungsstudien) ist die Grundvoraussetzung jeder statistischen Auswertung.


Versuchsbeschreibung


Wenn Sie Ihre Daten beschreiben, haben Sie bitte immer die folgenden fünf Punkte im Kopf:

  1. Versuchseinheiten: Was ist die Versuchseinheit? In einem Laborversuch könnten die Versuchseinheiten z.B. einzelne Pflanzen, Tiere oder Zellkulturen in Petrischalen sein. In einem Feld- oder Gewächshausversuch sind es möglicherweise einzelne Pflanzen, Schläge oder ganze Felder.

  2. Randomisierungsstruktur: Randomisierung heißt, dass die Behandlungen von Interesse wiederholt und zufällig den einzelnen Versuchseinheiten zugeteilt werden, auf wenigstens einer Stufe des Versuchs. Benennen Sie Ihre Randomisierungsstruktur mit einem fest definierten Begriff (“vollständig randomisiert”, “Spaltanlage”, “Streifenanlage”, …) oder beschreiben Sie sie detailliert (ein Foto oder eine Skizze ist oft hilfreich). Wie wurden die Versuchseinheiten in Zeit und Raum arrangiert? Welche Substrukturen gibt es (z.B. technische Wiederholungen, Subsampling, …)?

  3. Zielgrößen: Welche Größen messen den Effekt von Interesse? Wie wurden diese gemessen (kontinuierlich, diskrete Anzahlen von Ereignissen oder Individuen, Prozentwerte/Proportionen, Quotienten zweier Variablen, …)?

  4. Einflussgrößen: Welche Variablen oder Faktoren sollten die Unterschiede in den Zielgrößen erklären? Wie viele Faktorstufen gibt es? Welche Faktoren/Variablen sind von primärem Interesse?

  5. Versuchsfrage: Erklären Sie das Ziel Ihrer Arbeit so präzise wie möglich! Wenn Sie sich nicht sicher sind, welche Versuchsfragen von Interesse sind, besprechen Sie sich zuerst mit Ihrem Betreuer! “Ich möchte herausfinden, wie sich erhöhte Stickstoffdüngung auf die Blattfläche auswirkt”, ist ein legitimes Forschungsziel. “Ich möchte signifikante p-Werte haben”, nicht.


Daten aufräumen


  • Wenn möglich, schicken Sie uns Ihre Daten bitte als txt- oder csv-Datei. xls-Dateien aus Excel können wir ebenfalls akzeptieren.

  • Daten, die zusammen ausgewertet werden sollen, sollten in einer einzigen Datei stehen (bei xls-Dateien: in einem einzigen Tabellenblatt).

  • Notieren Sie Ihre Daten im flat file format: Jede Versuchseinheit (Pflanze, Tier, Topf, Petrischale, …) bekommt eine eigene Zeile in der Datentabelle, d.h. alle Informationen über eine bestimmte Versuchseinheit stehen in einer Zeile. Die Spalten enthalten die Werte der beobachteten Variablen und kontrollierten Faktoren und außerdem Information darüber, aus welchem Teilversuch oder welcher Randomisierungsstruktur die jeweilige Versuchseinheit stammt (z.B. in welchem Block sie stand).

  • Alle Spalten sollten (kurze) Überschriften haben, die Buchstaben und Zahlen enthalten dürfen, aber keine Sonderzeichen (ä ß µ % $), mathematischen Operatoren (+ - * / ^), Klammern oder Leerzeichen. Unterstriche (nicht Unterstreichungen) sind okay.

  • Kodieren Sie fehlende Werte als “NA” und nicht mit Zahlen wie 0 oder 999.

  • Halten Sie alle Versuchsstrukturen fest, die einen Einfluss auf die Zielgrößen haben könnten, indem Sie neue Variablen (d.h. neue Spalten in der Datentabelle) einfügen, selbst wenn diese nicht von direktem Interesse sind (z.B. wenn Teile des Versuchs in aufeinander folgenden Wochen durchgeführt wurden, legen Sie eine eine neue Spalte an, die benennt, welche Beobachtung aus welcher Woche stammt).

  • Wenn Sie uns eine xls-Datei schicken, vermeiden Sie in dem Tabellenblatt mit den Daten für die statistische Auswertung bitte einige Dinge:

    • Formeln, Berechnungen und Grafiken

    • Kommentare und Erläuterungen

    • leere Zeilen, Spalten oder Zellen innerhalb der Tabelle

    • Farben, andere Schriftarten, Fettschrift usw. als einziges Unterscheidungsmerkmal für verschiedene Behandlungen, Wiederholungen o.Ä.

    • Verlinkungen zu anderen Dokumenten

    • mehrere Tabellen in einem Tabellenblatt


Ein Datensatz im flat file format, bei dem alles eindeutig deklariert ist, könnte so aussehen:

 

Jahr

Ort

Duenger

Gewicht

Blattflaeche

Qualitaet

2012

Ruthe

A

22.43

117.4

2

2012

Ruthe

B

25.91

129.3

3

2012

Ruthe

C

26.11

NA

2

2012

Ruthe

D

29.98

138.5

1

2012

Hannover

A

23.57

120.1

3

2012

Hannover

B

26.92

125.6

3

2013

Ruthe

A

21.88

118.2

2

2013

Ruthe

B

23.56

123.3

3