Spis treści książki
Spis treści rozdziałów
Poprzednia strona
Następna strona
Definicje operacyjne
Aby przetestować pomysł, trzeba zebrać dane. Oznacza to powiązanie słów w twierdzeniu z konkretnymi, mierzalnymi zdarzeniami w świecie. Aby wypełnić tę lukę, naukowcy potrzebują definicji operacyjnych. Są to definicje, które określają, jak coś zmierzyć lub wykryć.
Jak można przetestować twierdzenie, że 90% mocy mózgu jest niewykorzystane? Co można sobie uświadomić w tym momencie?
Rozważmy twierdzenie, że „90% mocy mózgu jest niewykorzystane”. Jest to stwierdzenie, które wielu ludzi zdaje się traktować poważnie.
Zdobywający Nagrodę Nobla neurofizjolog Sir John Eccles najwyraźniej powtórzył podobny pomysł w wykładzie z 1974 roku na Uniwersytecie Kolorado, choć dodał: „Jak można wziąć procent nieskończoności?”, więc nie był dosłowny. Niektórzy uważają, że twierdzenie to sięga sto lat wstecz do stwierdzenia Freuda, że 90% umysłu znajduje się pod powierzchnią, nieświadomie, jak 90% góry lodowej.
Nawet poparcie laureata Nagrody Nobla lub sławnego autorytetu nie czyni stwierdzenia prawdziwym. Aby przyjąć naukową postawę wobec tego twierdzenia, trzeba się zastanowić, jak można by je przetestować.
Po pierwsze trzeba by zdefiniować pojęcia. Czym jest „moc mózgu”? Jak ją zmierzyć? Jak określić jej procent?
Jeśli zastanowić się, jak takie twierdzenie zostałoby przetestowane, staje się jasne, że najprawdopodobniej twierdzenie, że „90% mózgu jest niewykorzystane” nigdy nie zostało przetestowane. To tylko zabawny pomysł.
Gdy ludzie to mówią, prawdopodobnie mają na myśli: „Większość ludzi ma wielki niewykorzystany potencjał”. Ładna dyskusja na temat „mitu dziesięciu procent” pojawia się tutaj: https://www.csicop.org/si/9903/ten-percent-myth.html.
Aby ocenić dowody, trzeba testować pomysły. Aby przetestować pomysły, trzeba zebrać dane. Aby zebrać dane, trzeba wymyślić, jak przełożyć słowa twierdzenia na operacje pomiarowe.
Jaki problem napotykają naukowcy za każdym razem, gdy próbują ocenić twierdzenie?
Innymi słowy, badacze muszą zdefiniować każde słowo w twierdzeniu, mówiąc, jakie działania lub operacje je mierzą. Jeśli słowa twierdzenia nie mogą być zdefiniowane w ten sposób, twierdzenie jest bez znaczenia z naukowego punktu widzenia. To tylko słowa.
Naukowcy stają przed tym problemem za każdym razem, gdy próbują przetestować jakąś ideę. Zawsze muszą zdecydować, jak przełożyć słowa twierdzenia na konkretne operacje pomiarowe.
Co to jest definicja operacyjna?
Naukowcy próbują sprostać temu wyzwaniu za pomocą specjalnego rodzaju definicji, definicji operacyjnej. Jest to definicja, która określa, jak coś zmierzyć lub wykryć.
Definicje operacyjne: Not Always Good
Niektórzy uczniowie rozwijają błędne przekonanie o definicjach operacyjnych. Myślą, że wszystkie definicje operacyjne są „dobre” lub naukowo zatwierdzone. To nie jest prawda!
Definicja operacyjna to tylko decyzja o operacjach, które mają coś mierzyć. Decyzja ta może być błędna.
Jakie błędne przekonanie rozwijają niektórzy studenci i dlaczego jest ono błędne?
Na przykład, załóżmy, że ktoś chciałby badać szczęście. Aby go zbadać, trzeba go zmierzyć.
Prawdopodobnie najłatwiejszym sposobem operacjonalizacji szczęścia jest liczenie uśmiechów. Można to zrobić. Szczęście może być mierzone przez liczenie liczby uśmiechów, które dana osoba emituje podczas okresu obserwacji o określonej długości.
Jednakże liczenie uśmiechów jest słabą operacyjną definicją szczęścia. Pokazało to jedno z badań, w którym psychologowie z Cornell University przeanalizowali nagrania wideo graczy w kręgle i kibiców podczas meczu hokejowego.
Znaleźli oni, że uśmiechanie się rzadko występowało, gdy ludzie byli szczęśliwi, np. gdy drużyna gospodarzy zdobyła punkt. Zamiast tego, ludzie uśmiechali się głównie z powodów społecznych, takich jak przypadkowe wpadnięcie na kogoś (Rubenstein, 1980).
Jeśli liczenie uśmiechów nie jest dobrą operacyjną definicją szczęścia, to co jest dobrą operacyjną definicją szczęścia? Jak wymyślić dobrą procedurę pomiaru, gdy w grę wchodzi proces psychologiczny?
Nigdy nie jest łatwo odpowiedzieć na to pytanie. Szczęście lub subiektywne dobre samopoczucie (SWB) jest przedmiotem dziesięcioleci badań. Badacze robią, co mogą, używając ocen „zadowolenia z życia” i raportów o osobistym szczęściu (Diener, Suh, Lucas, & Smith, 1999).
Zmienne i wartości
Przez całą tę książkę będziemy odnosić się do zmiennych psychologicznych. Niektórzy studenci nie rozumieją pojęcia zmiennej, więc może to być dobry moment, aby wyjaśnić to pojęcie.
Zmienna jest jakąś cechą świata, która może się zmieniać lub zmieniać. Jest to coś, co może być zmierzone lub wykryte. Dlatego definicje operacyjne (które definiują słowo, mówiąc, jak zmierzyć lub wykryć coś) zawsze definiują zmienną.
Zmienne różnią się od wartości, które są liczbami lub wynikami. Zmienne mogą przyjmować wiele możliwych wartości, w zależności od tego, co jest mierzone.
Czym są zmienne? Jak odnoszą się one do definicji operacyjnych? Jaka jest różnica między zmienną a wartością?
Następująca tabela pokazuje przykłady zmiennych, definicji operacyjnych i wartości.
Zmienne, definicje operacyjne i wartości
Ostatnia definicja w tabeli (liczba włosów na lewym kciuku) przypomina nam o punkcie powyżej. Definicje operacyjne nie zawsze są dobre lub ważne. Są one po prostu opisami czynności pomiarowych.
Ostatnia definicja jest rzeczywiście definicją operacyjną, jeśli implikuje zestaw operacji pomiarowych (spójrz na lewy kciuk, policz włoski). Jest to jednak głupia definicja, jeśli ktoś chce mierzyć inteligencję.
Pierwsza i trzecia definicja również nie są zbyt dobre. Pierwsza z nich zrównuje inteligencję z umiejętnościami werbalnymi mierzonymi przez jeden standaryzowany test. To pomija wiele form inteligencji.
Druga i trzecia definicja są słabo sprecyzowane (jaki kwestionariusz? jaka naprawa?). Nie można zakładać, że definicja operacyjna jest ważna, tylko dlatego, że badacz generuje za jej pomocą liczbę.
Reliability and Validity
Jeśli definicje operacyjne nie zawsze są dobre, to jak odróżnić dobrą definicję od złej? To przywołuje dwa podstawowe pojęcia naukowe: niezawodność i ważność.
Dobra definicja operacyjna powinna być niezawodna i ważna. Oto definicje kapsuł:
Test jest wiarygodny, jeśli daje takie same wyniki, raz za razem, przy pomiarze tej samej rzeczy.
Test jest ważny, jeśli mierzy to, co myślisz, że mierzy, jak określono przez niezależne sposoby pomiaru tej samej rzeczy.
Jednym ze sposobów pomiaru wiarygodności jest wykonanie pomiarów przy dwóch różnych okazjach, upewniając się, że mierzysz dokładnie tę samą rzecz za każdym razem. Jeśli uzyskasz różne wyniki, mierząc tę samą rzecz przy dwóch różnych okazjach, instrument jest niewiarygodny.
Co to znaczy, że definicja jest wiarygodna? Wiarygodność?
W przypadku testu papierowo-ołówkowego, w którym używa się wielu pozycji, wiarygodność może być testowana przy użyciu metody split-halves. Pozycje o numerach nieparzystych są traktowane jako jeden test, pozycje o numerach parzystych jako drugi, a obie połówki są porównywane. Jeśli się zgadzają, test jest bardziej prawdopodobne, że jest wiarygodny.
Jak działa technika „dzielenia połowy”?
Nie każdy instrument pomiarowy może być podzielony w ten sposób. Wiarygodność testuje się zazwyczaj za pomocą powtarzanych pomiarów: wielokrotne mierzenie tej samej rzeczy.
W przypadku ludzkich zdolności, dwukrotne zmierzenie tej samej rzeczy może być trudne. Efekty praktyki pojawiają się, gdy osoba jest wystawiona na działanie testu lub techniki pomiarowej.
Ludzie zmieniają sposób, w jaki reagują na test, w oparciu o swoje doświadczenia z pierwszym podejściem do niego. Może to być świadome lub nie, ale sprawia, że powtarzane pomiary są bezużyteczne jako kontrola rzetelności.
W tym przypadku rzetelność musi być oceniana poprzez użycie tego samego testu na wielu różnych osobach. Często jest to jedyny sposób na sprawdzenie testów psychologicznych. Rzetelność jest oceniana w długim okresie czasu poprzez śledzenie niezawodności testu.
Jak efekty praktyki utrudniają badanie rzetelności?
Ważność została opisana jako właściwość, którą posiada test, jeśli „mierzy to, co myślisz, że mierzy”. Jak się ją określa?
Zdrowa ocena trafności polega na tym, że pomiar wydaje się sensowny na pierwszy rzut oka. To się nazywa ważność nominalna. Jest to po prostu opinia, że technika pomiarowa brzmi dobrze.
Ważność nominalna nie jest zbyt użyteczna dla naukowców. W rzeczywistości może być problemem, ponieważ test o wysokiej wiarygodności nominalnej może nie zostać zakwestionowany, nawet jeśli daje mylące wyniki (jak zrównanie uśmiechu ze szczęściem, przykład użyty wcześniej).
Eksperci w dziedzinie testowania wymieniają kilka innych rodzajów wiarygodności, które są ważniejsze niż wiarygodność nominalna. Wszystkie są wariacjami na temat trafności predykcyjnej. Test lub pomiar jest ważny, jeśli można go użyć do dokonania dokładnych przewidywań.
Co to jest ważność twarzowa? Ważność predykcyjna?
Na przykład, test zatrudnienia ma na celu określenie, kto jest odpowiedni do danej pracy. Jeśli test dokładnie przewiduje, kto pozostanie w pracy i otrzyma dobre oceny, ma on ważność predykcyjną.
Mierniki samooceny: Jeden szczególny rodzaj definicji operacyjnej jest dobrze znany ze swojego braku wiarygodności: pomiary autoreferencyjne. Pomiar autoreferencyjny jest definicją operacyjną, w której osoba ustnie relacjonuje swoje zachowanie lub treści umysłowe.
Przykładami pomiarów autoreferencyjnych są pytania: „Jak bardzo boli cię w skali od 1 do 10?”, „Czy śnisz w kolorze?” lub „Ile kalorii zjadłeś wczoraj?”. Większość ludzi zgodzi się odpowiedzieć na takie pytania, ale wyniki nie są niezawodne. W rzeczywistości pomiary samokontroli są notorycznie niedokładne i niewiarygodne.
Samokontrole retrospektywne są najmniej dokładnym typem. Prosimy osobę, aby spojrzała wstecz w czasie i przypomniała sobie szczegóły wcześniejszych zachowań lub doświadczeń.
Przykładem jest pytanie ludzi o to, jakie potrawy jedli poprzedniego dnia. Jest to retrospektywna autoreprezentacja. Łączy on niepewność autoreferencji z niepewnością rekonstrukcji pamięci.
Jednym z problemów z retrospektywnymi autoreferencjami jest to, że ludzie mogą dodawać lub odejmować szczegóły. Ale błędy mogą być większe niż to. Kiedy ludzie proszeni są o przypomnienie sobie zdarzeń z wcześniejszego okresu życia, nawet ci, którzy bardzo starają się mówić prawdę, niekoniecznie są w stanie odróżnić twórczą fabrykację od prawdziwego wspomnienia.
Problem polega na tym, że każde wspomnienie jest świeżą kreacją i zazwyczaj wydaje się dokładne, niezależnie od tego, czy jest, czy nie. Zobaczymy na to dowody w co najmniej trzech różnych miejscach tej książki: w badaniach nad hipnozą, w badaniach nad pamięcią i w badaniach nad zeznaniami naocznych świadków.
Co jest nie tak z pomiarami autoreferencyjnymi? Jaki jest ich najmniej dokładny typ?
W szkole średniej moi profesorowie dyskutowali o niedokładności retrospektywnych danych z autoreferencji. W jednym z badań poprosiłem studentów o oszacowanie (z dokładnością do pół godziny) ilości czasu, jaki spędzili na studiowaniu rozdziału z poprzedniego tygodnia. Wszyscy moi studenci zgodzili się odpowiedzieć na to pytanie.
Nikt nie powiedział „Nie pamiętam” lub „Nie potrafię tego oszacować”. Zakładając, że informacje są dokładne, przygotowałam się do wykorzystania ich w moich badaniach.
Wtedy zgubiłam część kwestionariuszy. Nie było problemu: studenci radośnie wypełnili identyczne, duplikaty kwestionariuszy.
Dzień później znalazłem oryginalne kwestionariusze, więc porównałem oba zestawy, aby sprawdzić, jak wypadły dane. Ku mojemu zaskoczeniu, szacunki dotyczące czasu nauki były zupełnie inne!
Student, który wpisał „4 godziny” w pierwszym kwestionariuszu, w drugim mógł wpisać „1,5 godziny”. Te dwie odpowiedzi pochodziły od tego samego studenta, pytanego o ten sam rozdział (zadanie z poprzedniego tygodnia) w dwóch kolejnych dniach.
Byłem przerażony, ale była to cenna lekcja. Moja operacyjna definicja czasu nauki, wykorzystująca retrospektywną samoocenę studenta, była wyraźnie niewiarygodna.
Więc nie była też ważna. Nie mierzyła tego, co myślałem, że mierzy. Odpowiedzi udzielone jednego dnia nie pozwalały nawet przewidzieć odpowiedzi udzielonych następnego dnia.
Jeśli ktoś musi użyć danych z autoreferencji, zawsze powinien je tak oznaczyć. (Słowo „oni” jest tu użyte, ponieważ słowo „dane” jest w liczbie mnogiej; „datum” jest formą liczby pojedynczej.)
Co należy zawsze robić, jeśli używa się danych z autoreferencji?
Na przykład, osoba pytająca ludzi, czy są szczęśliwi, zbiera dane z autoreferencji. Badacz powinien ostrzec czytelników, oznaczając te dane jako self-reported happiness.
Takie podejście stosuje się na przykład w przypadku problemu pomiaru szczęścia. Badacze powszechnie używają danych samo-sprawozdawczych oznaczonych jako takie, lub używają terminu subiektywne samopoczucie. Słowo subiektywny oznacza, że jest to raport własny.
———————
Diener, E., Suh, E. M., Lucas, R. E., & Smith, H. E. (1999). Subiektywny dobrostan: Trzy dekady postępu. Psychological Bulletin, 125, 276-302.
Rubenstein, C (1980, luty). Kiedy się uśmiechasz. Psychology Today, p.18.
Prev page | Page top | Chapter Contents | Next page
Pisz do Dr. Dewey’a na adres [email protected].
Nie widzisz tego, czego potrzebujesz? Psych Web ma ponad 1000 stron, więc może to być w innym miejscu w witrynie. Przeprowadź specyficzne dla witryny wyszukiwanie w Google, używając pola poniżej.