Service-Navigation

Suchfunktion

Zum Problem der "Pseudo-Wiederholungen" bei der Verrechnung von weinbaulichen und kellerwirtschaftlichen Versuchen

Dr. W. K. Kast und G. Feurer
LVWO Weinsberg
E-Mail:
walter.kast@lvwo.bwl.de

1. Einleitung

Ein Experiment besteht aus 5 Komponenten: 1. Versuchshypothese, 2. Versuchsanlage, 3. Versuchsauswertung, 4. Statistische Verrechnung und 5. Interpretation der Ergebnisse (Hurlbert 1984). Ein Ziel der statistischen Bearbeitung der Versuchsergebnisse ist es, Irrtumswahrscheinlichkeiten für die Annahme und Ablehnung der Versuchshypothese zu gewinnen. Das dafür notwendige Berechnen einer Varianzanalyse ist heute mit Hilfe moderner EDV-Anlagen und guter Programme ein Standardverfahren, das leicht und schnell zu bewerkstelligen ist. Wesentlich größer als die Rechenprobleme sind die Probleme, die beim Testen der Hypothesen auftreten. Hier können auch die besten Computerprogramme wenig Hilfe bieten. Wichtig ist dabei die Auswahl des adäquaten Modells und die Übereinstimmung der Berechnungen mit der biologischen Realität.

Entscheidendes Kriterium ist die richtige Festlegung der Fehlervarianz vor der Berechnung der verschiedenen Testverfahren. Häufige Fehlerquelle bei der Berechnung der Fehlervarianz sind sogenannte "Pseudo-Wiederholungen" (Hurlbert 1984). Besondere Probleme durch "Pseudo-Wiederholungen" ergeben sich in weinbaulichen Versuchen bei der Verrechnung mehrjähriger Ergebnisse. Ähnlich gelagerte Schwierigkeiten entstehen häufig durch Messwiederholungen.

In den meisten weinbaulichen Veröffentlichungen wird leider der Rechengang der Varianzanalyse nicht nachvollziehbar beschrieben. In einzelnen Fällen deuten aber extrem geringe, von den eigenen Erfahrungen der Autoren erheblich abweichende Fehlervarianzen und Grenzdifferenzen darauf hin, dass die Prüfgrößen der Tests falsch berechnet wurden.

Ziel des vorliegenden Beitrags ist es, Hinweise für eine biometrisch sachgerechte Prüfung von Versuchshypothesen zu geben, die eine falsche Interpretation der Versuchsergebnisse vermeiden helfen. Es wird bewusst auf Zitate und Kritik einzelner Beispiele verzichtet, da die statistische Bearbeitung nur ein Teilaspekt der wissenschaftlichen Arbeit ist und die Resultate der betroffenen Veröffentlichungen nicht abgewertet werden sollen.

2. Unabhängigkeit der Stichproben

Bei der Berechnung einer Varianzanalyse müssen verschiedene Annahmen gemacht werden. Eine dieser Annahmen ist, dass die für die Prüfung einer Hypothese relevanten Wiederholungen voneinander unabhängig sein müssen. Die Zahl der Freiheitsgrade für die jeweilige Fehlervarianz in der Varianzanalyse wird festgelegt über die Zahl der unabhängigen Wiederholungen und die Zahl der Prüfglieder. Kempthorne (1952) gibt hierzu eine exakte Definition (S. 163 und 211): "Diejenige Einheit, welche einer Behandlung (Prüfglied, Faktorenstufe) unabhängig von anderen zugewiesen werden kann, liefert die Basis für die Berechnung des Versuchsfehlers." Bei der Testung von Hypothesen, wie F-Test, T-Test, Berechnung von Grenzdifferenzen und multiplen Mittelwertsvergleichen muss deshalb jeweils geprüft werden, ob die vorliegenden Messwerte "echte", d. h. unabhängige Wiederholungen sind.

Abhängige Wiederholungen ("Pseudo-Wiederholungen") sind Stichproben innerhalb der Versuchseinheit (Randomisationseinheit), z. B. Messwiederholungen oder Wiederholungen über die Jahre ohne jährlich neue Randomisation. Die Abhängigkeit wird nicht dadurch beseitigt, dass die Messungen in zeitlichen Abständen erfolgen (Hurlbert 1984). Die Varianzanalyse berechnet sich bei abhängigen Wiederholungen nach Tabelle 1. Mehrere Messungen aus einer Parzelle geben einen Schätzwert für den Stichprobenfehler, sind jedoch keine unabhängigen Wiederholungen im Versuch. Der Versuchsfehler (Fehlervarianz) ergibt sich aus der Varianz der Versuchseinheiten, vermindert um die erklärbaren Varianzen (z. B. Prüfgliedvarianz, Blockvarianz). Die Zahl der Freiheitsgrade des Versuchsfehlers wird durch abhängige Wiederholungen nicht erhöht.

Tabelle 1: Varianzanalyse mit abhängigen Wiederholungen


Varianzursache


Freiheitsgrade


MQ


F-Test




Prüfglieder

p-1

M1

M1/M3

Blöcke

b-1

M2

M2/M3

Blöcke x Prüfglieder

(b-1) (p-1)

M3

 

Stichprobenfehler

pb (n-1)

M4

 




Gesamt

pbn-1

 

 

3. "Pseudo-Wiederholungen" am Beispiel von Versuchen zum Einfluss von Pflanzenschutzmitteln auf das sensorische Bild von Most und Wein

In vielen Fällen ist leicht zu erkennen, ob Wiederholungen unabhängig oder abhängig sind. Ein typisches Beispiel für abhängige Wiederholungen sind Verkostungsergebnisse verschiedener Prüfer oder auch Verkostungsergebnisse zu verschiedenen Terminen. Die Fehlervarianz für Prüfglieder kann dabei nach Tabelle 1 oder analog zu einem normalen Blockversuch auch aus den Mittelwerten der abhängigen Wiederholungen berechnet werden.

Es kann sinnvoll sein, auch die Ergebnisse einzelner Prüfer oder getrennt nach verschiedenen Terminen zu verrechnen und diese Ergebnisse getrennt zu interpretieren. Zeitlich aufeinander folgende Beobachtungen während der Entwicklung des Weines kann man unter Umständen auch als mehrdimensionalen Beobachtungsvektor der betreffenden Versuchseinheit auffassen und eine entsprechende multivariate Auswertung vornehmen. Sollen derartige Auswertungen erfolgen, so ist es sinnvoll, sich vor der Versuchsplanung von einem Spezialisten für derartige Methoden beraten zu lassen, da die Anwendung komplexer Methoden ohne ein volles Verständnis die Gefahr falscher Interpretationen eher vergrößert. Etwas unklarer werden die Verhältnisse, wenn im Keller zusätzliche Wiederholungen angelegt werden oder ein anderer zusätzlicher Faktor (z. B. Behandlung mit und ohne SO 2 -Zusatz) im Keller hinzukommt. Geprüft werden soll nicht, ob die Weine unterschiedlich sind, sondern ob die Freilandbehandlungen unterschiedliche Ergebnisse bringen. Es ist dabei zu prüfen, ob das sensorische Ergebnis von in verschiedenen Behältern ausgebauten Trauben einer Parzelle hinsichtlich der Fehlereinflüsse unabhängig ist. Anhand eines extremen Beispiels werden die Verhältnisse schnell klar. Würde eine zufällig am Rand des Versuchsfeldes liegende Parzelle von geruchsintensiven Stoffen, die in einem benachbarten Jungfeld zur Abschreckung von Wild verwendet wurden, nachteilig beeinflusst, so findet sich dieser Geruch in allen aus diesem Traubengut im Keller angelegten Varianten oder Wiederholungen. Die im Keller angelegten Varianten oder Wiederholungen sind, wie das Beispiel zeigt, offensichtlich nicht unabhängige, sondern abhängige Wiederholungen und sollten nach dem in Tabelle 2 aufgeführten, einer Spaltanlage entsprechenden Modell verrechnet werden.

Tabelle 2: Varianzanalyse für Verkostungsergebnisse eines weinbaulichen Versuches mit getrenntem Ausbau der Freilandwiederholungen und zusätzlichen kellerwirtschaftlichen Ausbauvarianten


Varianzursache


Freiheitsgrade


MQ


F-Test




Blöcke (Freiland)

b-1

M1

M1/M3

Prüfglieder

p-1

M2

M2/M3

Blöcke x Prüfglieder

(b-1) (p-1)

M3

M3/M6

Kellerbehandlung

k-1

M4

M4/M6

Prüfglieder x Kellerbehandlung

(p-1) (k-1)

M5

M5/M6

Restfehler

p (b-1) (k-1)

M6

 




Gesamt

pbk-1

 

 

Bei Ausbauversuchen nach der Richtlinie 22-9 der BBA zur Prüfung des Einflusses von Pflanzenschutzmitteln (Englert et al. 1988) wird das Traubengut der Pflanzenschutzversuche nicht getrennt nach den Versuchswiederholungen geerntet. Das Erntegut aller Wiederholungen eines Prüfgliedes wird gemeinsam verarbeitet. Im Keller werden aus diesem Material neue Wiederholungen und zusätzliche Varianten (mit und ohne Reinzuchthefe) angelegt. Zur Prüfung der Frage, ob Pflanzenschutzmittel einen Einfluss auf die Sensorik der Weine hatten, kann bei einer derartigen Versuchsanlage und Auswertung die Biometrie nicht beitragen. Da die Zahl der Freilandwiederholungen auf eine reduziert ist, existiert keine Fehlervarianz, die zur Prüfung der eigentlichen Versuchshypothese geeignet ist. Durch kellerwirtschaftliche Varianten und Wiederholungen kann aus Sicht der Biometrie nur die Hypothese geprüft werden, ob die angelieferten Trauben unterschiedliche Eigenschaften hatten, d. h. unterschiedliche Weine ergeben. Nicht geprüft werden kann die Frage, ob die Behandlungen der Prüfglieder im Freiland die Ursache der Unterschiede sind oder ob eventuell vorhandene Unterschiede auf zufällig unterschiedlichen Eigenschaften der Freilandparzellen beruhen. Solche Einflüsse können z. B. unterschiedliches Ertragsniveau durch vorangegangene Versuche, Einflüsse extremer Trockenheit durch flachgründige Böden, Pilzbefall und viele andere, unbekannte Inhomogenitäten im Prüffeld (siehe Beispiel im vorherigen Abschnitt) sein. Da solche Fehlerquellen nie absolut ausgeschlossen werden können, dürfen Unterschiede nur dann einem Pflanzenschutzmittel zugeordnet werden, wenn dies offensichtlich ist. Bei offensichtlichen Ergebnissen jedoch ist jede Anwendung biometrischer Methoden sinnlos. In einzelnen Fällen sind die Ursachen der Geschmacksveränderungen durchaus offensichtlich, da sie vom sensorischen Typ der Veränderung her bestimmten Einflüssen zugeordnet werden können.

4. Mehrjährige Versuche

Die Leistungen von Reben sind extrem jahrgangsabhängig, wie schon Geisler und Staab (1958) feststellten. Um Jahre als unabhängige Wiederholungen verrechnen zu können, müsste jedoch bei mehrjährigen Versuchen in jedem Jahr eine neue Versuchsfläche mit neuer Randomisation der Behandlungsvarianten verwendet werden. In den meisten Fällen ist dies allerdings nicht machbar. Dies gilt z. B. für die Prüfung von Sorten und Klonen, Düngungs-, Anschnitt- und Erziehungsartenversuche. Wird aber nicht jedes Jahr neu randomisiert, so sind Einflüsse wie z. B. günstige oder ungünstige Bodenverhältnisse, kleinklimatische Einflüsse und ähnliches in allen Prüfjahren in einer bestimmten Versuchsparzelle dieselben. Die Messungen in einer Parzelle, z. B. Ertrags- und Mostgewichtsfeststellungen sind deshalb in verschiedenen Jahren offensichtlich nicht unabhängig. Es handelt sich eindeutig um abhängige Wiederholungen.

Die Berechnung der Varianzanalyse zur Prüfung der Versuchshypothese sollte zunächst mit den Messwerten der einzelnen Jahre getrennt durchgeführt werden und diese Ergebnisse unter den spezifischen Verhältnissen der einzelnen Jahre separat interpretiert werden. Eine einfache, zusammenfassende Varianzanalyse ist auf der Basis der Mittelwerte über die Jahre oder über Gruppenmittelwerte (Anfangsjahre, Endjahre) möglich. Die Zahl der Freiheitsgrade bleibt sowohl bei Verrechnung der Einzeljahre als auch der Mittelwerte gleich. Weitere Auswertungen können mit speziellen Verfahren als "repeated measurement design" oder auch multivariat erfolgen (siehe Snedecor und Cochran 1980, Seite 330 ff). Deren Anwendung sollte aber in jedem Einzelfall vor Versuchsbeginn abgeklärt werden.

5. Literatur

1. Hurlbert, S. H. (1984): Pseudoreplication and the design of ecological field experiments. - Ecological Monographs 54, 187 - 211

2. Kempthorne, O. (1952): Design and Analysis of Experiments. - John Wiley and Sons, Inc. New York

3. Enlgert, W. D.; Flick, G.; Huber, W.; Ipach, R.; Kast, W. K.; Rapp, A.; Vornberger, T.; Wohlfahrt, P. (1988): Prüfung des Einflusses von Pflanzenschutzmitteln auf die Gärung von Traubenmost und die sensorisch wahrnehmbaren Eigenschaften bei Wein. - Herausgeber: Biologische Bundesanstalt Braunschweig

4. Geisler, G.; Staab, J. (1958): Versuchsanstellung im Weinbau. - Vitis 1, 257 281

5. Snedecor, G. W.; Cochran, W. G. (1980): Statistical Methods. - The Iowa State University Press (seventh edition)

6. Sokal, R. R.; Rohlf, F. J. (1981): Biometry. - W. H. Freeman and Company, New York

Fußleiste