Inhaltsverzeichnis des Buches
Kapitelinhalt
Vorige Seite
Nächste Seite
Operative Definitionen
Um eine Idee zu testen, muss man Daten sammeln. Das bedeutet, Worte in einer Behauptung mit konkreten, messbaren Ereignissen in der Welt in Beziehung zu setzen. Um diese Lücke zu schließen, brauchen Wissenschaftler operationale Definitionen. Das sind Definitionen, die angeben, wie man etwas messen oder feststellen kann.
Wie kann man die Behauptung testen, dass 90% der Gehirnleistung ungenutzt sind? Was kann man dabei feststellen?
Betrachten Sie die Behauptung: „90 % der Gehirnleistung sind ungenutzt.“ Das ist eine Aussage, die viele Menschen ernst zu nehmen scheinen.
Der mit dem Nobelpreis ausgezeichnete Neurophysiologe Sir John Eccles soll 1974 in einer Vorlesung an der Universität von Colorado einen ähnlichen Gedanken geäußert haben, obwohl er hinzufügte: „Wie kann man einen Prozentsatz der Unendlichkeit nehmen?“, er war also nicht wörtlich gemeint. Manche meinen, die Behauptung gehe ein Jahrhundert zurück auf Freuds Aussage, dass 90% des Geistes unter der Oberfläche liegen, unbewusst, wie 90% eines Eisbergs.
Auch die Bestätigung durch einen Nobelpreisträger oder eine berühmte Autorität macht eine Aussage nicht wahr. Um eine wissenschaftliche Haltung zu dieser Behauptung einzunehmen, muss man sich überlegen, wie sie geprüft werden könnte.
Zunächst müsste man die Begriffe definieren. Was ist „die Leistung des Gehirns“? Wie misst man sie? Wie nimmt man einen Prozentsatz davon?
Wenn man darüber nachdenkt, wie eine solche Behauptung getestet werden würde, wird klar, dass die Behauptung „90% des Gehirns sind ungenutzt“ aller Wahrscheinlichkeit nach nie getestet wurde. Es ist nur eine unterhaltsame Idee.
Wenn Leute das sagen, meinen sie wahrscheinlich: „Die meisten Menschen haben ein großes ungenutztes Potenzial.“ Eine schöne Diskussion über den „Zehn-Prozent-Mythos“ gibt es hier: https://www.csicop.org/si/9903/ten-percent-myth.html.
Um Beweise zu bewerten, muss man Ideen testen. Um Ideen zu testen, muss man Daten sammeln. Um Daten zu sammeln, muss man herausfinden, wie man die Worte einer Behauptung in Messoperationen übersetzt.
Welchem Problem stehen Wissenschaftler jedes Mal gegenüber, wenn sie versuchen, eine Behauptung zu bewerten?
Mit anderen Worten, Forscher müssen jedes Wort in einer Behauptung definieren, indem sie sagen, welche Aktionen oder Operationen es messen. Wenn die Worte einer Behauptung nicht auf diese Weise definiert werden können, ist die Behauptung aus wissenschaftlicher Sicht bedeutungslos. Es sind nur Worte.
Wissenschaftler stehen diesem Problem jedes Mal gegenüber, wenn sie versuchen, eine Idee zu testen. Sie müssen immer entscheiden, wie sie die Worte einer Behauptung in spezifische Messoperationen übersetzen können.
Was ist eine operationale Definition?
Wissenschaftler versuchen, dieser Herausforderung mit einer speziellen Art von Definition zu begegnen, der operationalen Definition. Das ist eine Definition, die angibt, wie etwas zu messen oder zu erkennen ist.
Operative Definitionen: Nicht immer gut
Einige Schüler entwickeln eine falsche Vorstellung von operationalen Definitionen. Sie denken, dass alle operationalen Definitionen „gut“ oder wissenschaftlich anerkannt sind. Das ist nicht der Fall!
Eine operationale Definition ist nur eine Entscheidung über Operationen, um etwas zu messen. Die Entscheidung kann fehlerhaft sein.
Welchen Irrglauben entwickeln manche Studenten, und warum ist er falsch?
Angenommen, man wollte Glück studieren. Um es zu studieren, muss man es messen.
Vielleicht ist es am einfachsten, Glück zu operationalisieren, indem man Lächeln zählt. Das kann man tun. Glück kann gemessen werden, indem man die Anzahl der Lächeln zählt, die eine Person während eines Beobachtungszeitraums von bestimmter Länge aussendet.
Doch das Zählen von Lächeln ist eine schlechte operationale Definition von Glück. Das zeigte eine Studie, in der Psychologen der Cornell University Videoaufnahmen von Bowlern und Fans bei einem Eishockeyspiel analysierten.
Sie fanden heraus, dass das Lächeln nur selten auftrat, wenn die Menschen glücklich waren, etwa wenn die Heimmannschaft ein Tor erzielte. Stattdessen lächelten die Menschen meist aus sozialen Gründen, z. B. wenn sie zufällig jemanden anrempelten (Rubenstein, 1980).
Wenn das Zählen von Lächeln keine gute operationale Definition von Glück ist, was ist dann eine gute operationale Definition von Glück? Wie kommt man zu einem guten Messverfahren, wenn es sich um einen psychologischen Prozess handelt?
Diese Frage ist nie einfach zu beantworten. Glück oder subjektives Wohlbefinden (SWB) ist eigentlich Gegenstand jahrzehntelanger Forschung. Forscher tun ihr Bestes, indem sie „Lebenszufriedenheits“-Ratings und Berichte über persönliches Glück verwenden (Diener, Suh, Lucas, & Smith, 1999).
Variablen und Werte
Im gesamten Buch werden wir uns auf psychologische Variablen beziehen. Einige Studenten können mit dem Begriff „Variable“ nichts anfangen, daher ist dies ein guter Zeitpunkt, um das Konzept zu erklären.
Eine Variable ist ein Merkmal der Welt, das variieren oder sich verändern kann. Sie ist etwas, das gemessen oder festgestellt werden kann. Deshalb definieren operationale Definitionen (die ein Wort definieren, indem sie sagen, wie man etwas messen oder feststellen kann) immer eine Variable.
Variablen unterscheiden sich von Werten, die Zahlen oder Werte sind. Variablen können viele mögliche Werte annehmen, je nachdem, was gemessen wird.
Was sind Variablen? Wie hängen sie mit operationalen Definitionen zusammen? Was ist der Unterschied zwischen einer Variable und einem Wert?
Die folgende Tabelle zeigt Beispiele für Variablen, operationale Definitionen und Werte.
Variablen, operationale Definitionen und Werte
Die letzte Definition in der Tabelle (Anzahl der Haare am linken Daumen) erinnert uns an den oben gemachten Punkt. Operationale Definitionen sind nicht immer gut oder gültig. Sie sind einfach Beschreibungen von Messaktionen.
Die letzte Definition ist in der Tat eine operationale Definition, wenn sie eine Menge von Messoperationen impliziert (linker Daumen anschauen, Haare zählen). Sie ist aber eine dumme Definition, wenn man Intelligenz messen will.
Die erste bis dritte Definition sind auch nicht sehr gut. Die erste setzt Intelligenz mit verbalen Fähigkeiten gleich, die durch einen standardisierten Test gemessen werden. Das vernachlässigt viele Formen von Intelligenz.
Die zweite und dritte Definition sind schlecht spezifiziert (welcher Fragebogen? welche Reparatur?). Man kann nicht davon ausgehen, dass eine operationale Definition gültig ist, nur weil ein Forscher damit eine Zahl generiert.
Zuverlässigkeit und Validität
Wenn operationale Definitionen nicht immer gut sind, wie kann man dann eine gute von einer schlechten unterscheiden? Hier kommen zwei grundlegende wissenschaftliche Konzepte ins Spiel: Zuverlässigkeit und Gültigkeit.
Eine gute operationale Definition sollte zuverlässig und gültig sein. Hier sind Kapseldefinitionen:
Ein Test ist zuverlässig, wenn er immer wieder die gleichen Ergebnisse liefert, wenn er die gleiche Sache misst.
Ein Test ist valide, wenn er das misst, was man glaubt, dass er misst, wie durch unabhängige Messungen der gleichen Sache festgestellt wird.
Eine Möglichkeit, die Reliabilität zu messen, besteht darin, Messungen bei zwei verschiedenen Gelegenheiten durchzuführen und sicherzustellen, dass man beide Male genau die gleiche Sache misst. Wenn Sie unterschiedliche Ergebnisse erhalten, wenn Sie die gleiche Sache bei zwei verschiedenen Gelegenheiten messen, ist das Instrument unzuverlässig.
Was bedeutet es, zu sagen, dass eine Definition zuverlässig ist? Gültig?
Bei einem Papier- und Bleistifttest, der viele Items verwendet, kann die Reliabilität mit der Split-Halves-Methode getestet werden. Ungerade Items werden als ein Test behandelt, gerade Items als ein anderer, und die beiden Hälften werden miteinander verglichen. Wenn sie übereinstimmen, ist der Test mit größerer Wahrscheinlichkeit zuverlässig.
Wie funktioniert die „Split-Halves“-Methode?
Nicht jedes Messinstrument kann auf diese Weise aufgeteilt werden. Die Reliabilität wird üblicherweise mit wiederholten Messungen getestet: die gleiche Sache wiederholt messen.
Bei menschlichen Fähigkeiten kann es schwierig sein, die gleiche Sache zweimal zu messen. Übungseffekte treten auf, wenn eine Person einem Test oder einem Messverfahren ausgesetzt ist.
Personen ändern die Art und Weise, wie sie auf den Test reagieren, basierend auf ihren Erfahrungen bei der ersten Durchführung des Tests. Dies kann bewusst oder unbewusst geschehen, macht aber wiederholte Messungen als Reliabilitätsprüfung unbrauchbar.
In diesem Fall muss die Reliabilität durch die Verwendung desselben Tests an vielen verschiedenen Probanden überprüft werden. Oft ist das die einzige Möglichkeit, psychologische Tests zu überprüfen. Die Reliabilität wird über einen langen Zeitraum beurteilt, indem man die Verlässlichkeit des Tests verfolgt.
Wie erschweren Praxiseffekte die Reliabilitätsprüfung?
Validität wurde als eine Eigenschaft beschrieben, die ein Test besitzt, wenn er „das misst, was man glaubt, dass er misst.“ Wie wird das bestimmt?
Ein Urteil des gesunden Menschenverstands über Validität ist, dass eine Messung auf den ersten Blick vernünftig erscheint. Das wird als „face validity“ bezeichnet. Es ist nur eine Meinung, dass ein Messverfahren gut klingt.
Face validity ist für Wissenschaftler nicht sehr nützlich. Sie kann sogar ein Problem sein, weil ein Test mit hoher Augenscheinvalidität unangefochten bleiben kann, obwohl er irreführende Ergebnisse liefert (wie die Gleichsetzung von Lächeln mit Glück, das oben genannte Beispiel).
Testexperten führen mehrere andere Arten von Validität auf, die wichtiger sind als Augenscheinvalidität. Alle sind Variationen des Themas der prädiktiven Validität. Ein Test oder eine Messung ist valide, wenn man damit genaue Vorhersagen machen kann.
Was ist Face Validity? Prädiktive Validität?
Zum Beispiel: Ein Einstellungstest soll feststellen, wer für eine Stelle geeignet ist. Wenn der Test genau vorhersagt, wer im Job bleibt und gute Bewertungen erhält, hat er prädiktive Validität.
Selbstauskünfte: Notoriously Unreliable
Eine bestimmte Art von operationalen Definitionen ist für ihre mangelnde Zuverlässigkeit bekannt: Selbstbericht-Maßnahmen. Eine Selbstbericht-Maßnahme ist eine operationale Definition, bei der eine Person verbal über ihr eigenes Verhalten oder ihre mentalen Inhalte berichtet.
Beispiele für Selbstbericht-Maßnahmen sind die Fragen „Wie stark empfinden Sie Schmerzen auf einer Skala von 1 bis 10?“ oder „Träumen Sie in Farben?“ oder „Wie viele Kalorien haben Sie gestern gegessen?“ Die meisten Menschen werden sich bereit erklären, solche Fragen zu beantworten, aber die Ergebnisse sind nicht verlässlich. Tatsächlich sind Selbsteinschätzungen notorisch ungenau und unzuverlässig.
Retrospektive Selbsteinschätzungen sind die am wenigsten genaue Art. Sie bitten eine Person, in die Vergangenheit zurückzublicken, um sich an Details früherer Verhaltensweisen oder Erfahrungen zu erinnern.
Ein Beispiel ist die Frage, welche Lebensmittel sie am Vortag gegessen haben. Dies ist ein retrospektiver Selbstbericht. Er kombiniert die Unsicherheit des Selbstberichts mit der Unsicherheit der Gedächtnisrekonstruktion.
Ein Problem bei retrospektiven Selbstberichten ist, dass Menschen Details hinzufügen oder weglassen können. Aber die Fehler können größer sein als das. Wenn man Menschen bittet, sich an Ereignisse aus einem früheren Leben zu erinnern, können selbst Menschen, die sich sehr bemühen, die Wahrheit zu sagen, nicht unbedingt zwischen einer kreativen Erfindung und einer echten Erinnerung unterscheiden.
Das Problem ist, dass jede Erinnerung eine Neuschöpfung ist, und sie fühlt sich normalerweise genau an, ob sie es ist oder nicht. Wir werden Beweise dafür an mindestens drei verschiedenen Stellen in diesem Buch sehen: in der Studie der Hypnose, der Studie des Gedächtnisses und der Studie von Augenzeugenaussagen.
Was ist falsch an Selbstberichtsmessungen? Welcher Typ ist am ungenauesten?
In der Graduiertenschule diskutierten meine Professoren über die Ungenauigkeit von retrospektiven Selbstberichtsdaten. Die Wahrheit wurde mir jedoch erst bewusst, als ich für meine Doktorarbeit das Lernen von Studenten untersuchte.
In einer Studie bat ich die Studenten, die Zeit zu schätzen (auf die nächste halbe Stunde genau), die sie mit dem Lernen des Kapitels der vergangenen Woche verbracht hatten. Alle meine Studenten stimmten zu, diese Frage zu beantworten.
Niemand sagte „Ich kann mich nicht erinnern“ oder „Ich kann diese Schätzung nicht machen.“ In der Annahme, dass die Informationen korrekt waren, bereitete ich mich darauf vor, sie in meiner Forschung zu verwenden.
Dann verlor ich einige der Fragebögen. Kein Problem: Die Studenten füllten fröhlich identische, doppelte Fragebögen aus.
Einen Tag später fand ich die Originalfragebögen, also verglich ich die beiden Sätze, um zu sehen, wie die Daten verglichen wurden. Zu meinem Schock waren die Schätzungen der Studienzeit völlig unterschiedlich!
Ein Student, der auf dem ersten Fragebogen „4 Stunden“ angab, konnte auf dem zweiten „1 1/2 Stunden“ angeben. Diese beiden Antworten stammten von demselben Studenten, der an zwei aufeinanderfolgenden Tagen zum selben Kapitel (der Aufgabe der Vorwoche) befragt wurde.
Ich war bestürzt, aber es war eine wertvolle Lektion. Meine operationale Definition von Lernzeit, die den retrospektiven Selbstbericht des Studenten verwendet, war eindeutig unzuverlässig.
Deshalb war sie auch nicht gültig. Es wurde nicht das gemessen, was ich dachte, dass es misst. Die Antworten an einem Tag sagten nicht einmal die Antworten am nächsten Tag voraus.
Wenn man Selbstberichtdaten verwenden muss, sollten sie immer als solche gekennzeichnet werden. (Das Wort „sie“ wird hier verwendet, weil das Wort „Daten“ Plural ist; „Daten“ ist die Singularform.)
Was sollte man immer tun, wenn man Selbstauskunftsdaten verwendet?
Zum Beispiel: Eine Person, die Menschen fragt, ob sie glücklich sind, sammelt Selbstauskunftsdaten. Der Forscher sollte die Leser warnen, indem er diese Daten als „self-reported happiness“ bezeichnet.
Dieser Ansatz wird zum Beispiel verwendet, um mit dem Problem der Glücksmessung umzugehen. Forscher verwenden häufig Selbstberichtsdaten, die als solche gekennzeichnet sind, oder sie verwenden den Begriff subjektives Wohlbefinden. Das Wort subjektiv bedeutet, dass es sich um einen Selbstbericht handelt.
———————
Diener, E., Suh, E. M., Lucas, R. E., & Smith, H. E. (1999). Subjektives Wohlbefinden: Three decades of progress. Psychological Bulletin, 125, 276-302.
Rubenstein, C. (1980, Februar). When you’re smiling. Psychology Today, S.18.
Vorige Seite | Seitenanfang | Kapitelinhalt | Nächste Seite
Schreiben Sie an Dr. Dewey unter [email protected].
Sehen Sie nicht, was Sie brauchen? Psych Web hat über 1.000 Seiten, also kann es an anderer Stelle auf der Site sein. Führen Sie eine Site-spezifische Google-Suche durch, indem Sie das Feld unten verwenden.