Wieczorkowska G., Kochański P., Eljaszuk M.- Statystyka . Wprowadzenie do analizy danych sondażowych i eksperymentalnych.pdf

(1651 KB) Pobierz
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
STATYSTYKA
Wprowadzenie do analizy danych
sondażowych i eksperymentalnych
Grażyna Wieczorkowska
oraz
Piotr Kochański
Magdalena Eljaszuk
STATYSTYKA
Wprowadzenie do analizy danych
sondażowych i eksperymentalnych
Wydawnictwo Naukowe Scholar
Redakcja i korekta: Magdalena Eljaszuk, Magdalena Pluta
Projekt okładki: Marta Karczewska
Grafiki w tekście i na okładce: Rafał Kucharczuk
Copyright 2004 by Wydawnictwo Naukowe Scholar, Spółka z o.o., Warszawa
ISBN 83-7383-083-9
Wydawnictwo Naukowe „Scholar" Spółka z o.o.
ul. Krakowskie Przedmieście 62, 00-322 Warszawa
tel./fax 828 95 63, 826 59 21, 828 93 91
dział handlowy 635 74 04 wew. 219 lub jw. wew. 105,108
e-mail: info@scholar.com.pl
http://www.scholar.com.pl
Wydanie drugie poprawione
Skład i łamanie: WN „Scholar" (Jerzy Łazarski)
Druk i oprawa: Paper & Tinta, Warszawa
Spis treści
Wstęp........................................................ 9
Literatura................................................ 14
Rozdział 1.
Naukowy sposób poszukiwania związków między zmiennymi.
Rodzaje badań ................................................ 15
1.1. Wprowadzenie............................................. 15
1.2. Operacjonalizacja zmiennych teoretycznych...................... 18
1.3. Badania korelacyjne......................................... 20
1.4. Badania eksperymentalne..................................... 22
1.5. Porównanie badań eksperymentalnych i korelacyjnych............. 24
1.6. Analiza przykładów badań.................................... 27
1.7. Test intuicji psychologicznej: zbiór danych „LEARN".
Sposób zapisywania wyników w komputerze..................... 30
1.8. Co oznaczają liczby w naukach społecznych? Skale pomiarowe.
Zmienne nominalne, porządkowe i ilościowe
(przedziałowe i ilorazowe).................................... 35
1.9. Typ skali pomiarowej a rodzaj dopuszczalnych przekształceń........ 41
Rozdział 2.
Rozkład zmiennej w próbie i w populacji. Miary tendencji centralnej
i rozproszenia.................................................. 45
2.1. Rozkład zmiennej w próbie................................... 45
2.2. Statystyki opisowe rozkładu zmiennej. Miary tendencji centralnej
i rozproszenia.............................................. 51
2.3. Standaryzacja.............................................. 60
2.4. Rozkład zmiennej w populacji................................. 63
2.5. Rozkład normalny (rozkład Gaussa)............................ 66
2.6. Sposoby wykorzystania informacji dotyczącej normalności rozkładu
zmiennej w populacji........................................ 70
Rozdział 3.
Wizualizacja danych. Tworzenie wskaźników złożonych.............. 75
3.1. Tworzenie wskaźników...................................... 75
3.2. Typowe problemy występujące przy tworzeniu wskaźników......... 80
3.3. Trafność i rzetelność wskaźnika. Współczynnik a Cronbacha........ 83
3.4. Ograniczenia i wady a Cronbacha.............................. 86
3.5. Przykład zastosowania analizy czynnikowej do tworzenia
wskaźników............................................... 88
3.6. Wprowadzenie do wizualizacji danych.......................... 97
3.7. Wizualizacja rozkładu zmiennej ............................... 99
3.8. Wizualizacja zależności między zmiennymi...................... 111
Rozdział 4.
Testowanie hipotez statystycznych. Rozkład statystyki................ 117
4.1. Jak na podstawie próby możemy wnioskować o całej populacji? ..... 117
4.2. Rozkład zmiennej w populacji i w próbie oraz rozkład statystyki,
na przykładzie populacji marsjańskiej........................... 118
4.3. Miary tendencji centralnej rozkładu statystyki.................... 123
4.4. Miary rozproszenia rozkładu statystyki ......................... 124
4.5. W jaki sposób praktycznie wykorzystujemy znajomość rozkładu
średnich (statystyki M)l ..................................... 126
4.6. Porównanie trzech typów rozkładów............................ 128
4.7. Centralne Twierdzenie Graniczne.............................. 130
4.8. Hipotezy statystyczne ....................................... 134
4.9. Kierunkowe i bezkierunkowe hipotezy badawcze.................. 138
4.10. Etapy testowania hipotez..................................... 140
4.11. Etapy wnioskowania statystycznego na podstawie wydruku
komputerowego............................................ 154
4.12. Ryzyko błędu.............................................. 155
Rozdział 5.
Test t Studenta. Przedział ufności................................. 159
5.1. Rozkład t Studenta ......................................... 159
5.2. Zastosowanie testu t Studenta do testowania hipotezy
dla pojedynczej próby....................................... 161
5.3. Zastosowanie testu t do testowania hipotezy o równości średnich
na podstawie dwóch prób zależnych (schemat badawczy:
Pretest-Posttest) ........................................... 166
5.4. Zastosowanie testu t do porównania średnich na podstawie
prób niezależnych .......................................... 172
5.5. Przedział ufności dla średnich................................. 181
Rozdział 6.
Jednoczynnikowa analiza wariancji............................... 186
6.1. Ograniczenia stosowalności testu t Studenta.
Dlaczego 3 jest lepsze niż 2?.................................. 186
6.2. Jednoczynnikowa analiza wariancji............................. 187
6.3. RozkładFFishera.......................................... 190
6.4. Zastosowanie analizy wariancji do testowania hipotez
o równości średnich......................................... 193
6.5. Testy porównań poszczególnych średnich w analizie wariancji....... 210
Rozdział 7.
Dwuczynnikowa analiza wariancji................................ 217
7.1. Efekt interakcji ............................................ 217
7.2. Testowanie efektów głównych i interakcyjnych................... 221
7.3. Porównanie wyników jednoczynnikowej analizy wariancji
z analizą dwuczynnikowa.................................... 232
7.4. Analiza wariancji z powtarzanymi pomiarami.................... 237
Rozdział 8.
Pomiar związku między zmiennymi ilościowymi: współczynnik korelacji
liniowej i analiza regresji........................................ 242
8.1. Związek liniowy między zmiennymi ilościowymi.
Wykres korelacyjny (rozrzutu)................................. 242
8.2. Przewidywanie wyników zmiennej zależnej na podstawie wartości
zmiennej niezależnej. Błąd predykcji............................ 245
8.3. Testowanie istotności współczynnika korelacji.................... 253
8.4. Problemy w interpretacji współczynnika korelacji................. 257
8.5. Zastosowanie analizy regresji w badaniu LEARN.
Modyfikujący wpływ trzeciej zmiennej (grupa eksperymentalna)
na otrzymane zależności ..................................... 258
8.6. Regresja wielokrotna. Określanie związku zmiennej zależnej
z więcej niż jednym predyktorem.............................. 260
8.7. Korelacje cząstkowe........................................ 264
8.8. Wprowadzenie zmiennych nominalnych do równania regresji........ 267
Rozdział 9.
Test % dla zmiennych nominalnych .............................. 270
9.1. Test hipotezy o zgodności rozkładu empirycznego z teoretycznym
(oczekiwanym)............................................. 270
9.2. Test hipotezy o niezależności dwóch zmiennych nominalnych 275
9.3. Wyliczanie współczynników siły związku........................ 285
Rozdział 10.
Podsumowanie i wskazówki dotyczące wyboru testu statystycznego .... 288
Tablice ....................................................... 303
Książkę dedykuję Januszowi Grzelakowi i Eugene 'owi Burnsteinowi,
moim profesorom, współpracownikom i przyjaciołom
(w chronologicznej kolejności).
Spędziłam z nimi wiele godzin, analizując
dane zarówno eksperymentalne, jak i sondażowe.
G.W.
Wstęp
Od kilkunastu lat byłam namawiana do napisania podręcznika do statystyki. Na-
legali na to zarówno psychologowie, jak i lekarze, których dane (tak eksperymental-
ne, jak i sondażowe) analizowałam i którzy cenili sobie wysoko wyniki współpracy.
Jest tak zapewne dlatego, że mimo ukończonych studiów matematycznych statysty-
ka interesuje mnie tylko o tyle, o ile pomaga nam w wydobywaniu interesują-
cych informacji ze zgromadzonych danych. Sama od ponad 20 lat rozwiązuję za-
gadki psychologiczne i jestem przekonana, że wiedzielibyśmy już znacznie więcej,
gdyby badacze rozumieli, po co zbierają dane i co dalej się z nimi dzieje. Zrozu-
mienie istoty statystyki jest potrzebne także tym, którzy sami nie przeprowa-
dzają badań, ale je wykorzystują. Wszyscy dowiadujemy się, że wyniki badań
wykazały wzrost notowań rządu, że należy pić sok pomidorowy itd. Jeżeli nie rozu-
miemy istoty statystyki, nie jesteśmy w stanie trafnie ocenić tych doniesień.
Analizowałam sporo badań z różnych dziedzin psychologii, socjologii, edukacji,
medycyny i widziałam bezradność na przykład w oczach lekarzy, którzy nie rozumie-
li, co mogą, a czego nie mogąpowiedzieć na podstawie otrzymanych wyników. A
prze-
cież nie jest to trudne. Trzeba mieć tylko dobrego nauczyciela lub dobry podręcznik,
który wskaże drogę.
Niniejszy podręcznik jest efektem doświadczenia, jakie zebrałam w czasie pro-
wadzenia dwuletniej specjalizacji „Metodologia badań społecznych" na Wydziale
Psychologii Uniwersytetu Warszawskiego i wykładu „Metodologia ze statystyką"
w Szkole Wyższej Psychologii Społecznej.
Zaprosiłam do współpracy dwójkę młodych asystentów, którzy uczą „Zastosowań
komputerów w psychologii" w SWPS. Piotr Kochański (który napisał m.in. część
dotyczącą wizualizacji wyników) jest doktorem fizyki od lat pracującym z
psychologa-
mi. Magda Eljaszukjest magistrem psychologii i doktorantką Instytutu Studiów Spo-
łecznych Uniwersytetu Warszawskiego. To, jak należy uczyć analizy danych wszyscy
troje mieliśmy okazję podpatrywać u mistrzów - profesorów wykładających w najlep-
szej szkole letniej w zakresie metodologii badań ilościowych w naukach społecznych,
organizowanej już od 40 lat przez ICPSR (Inter-University Consortium for Political
Science). Ja w 1990 roku, Piotr w 1999, Magda w 2002 roku. Było to możliwe dzięki
stypendiom uzyskanym za pośrednictwem Instytutu Studiów Społecznych UW od In-
stitute for Social Research, University of Michigan, Ann Arbor.
Wstęp
10
Moi koledzy dziwią się, że nie nudzi mi się uczenie, co to jest wariancja, wynik
istotny statystycznie itd. Nie nudzi mi się, ponieważ cały czas szukam najlepszego
sposobu przekazania tej wiedzy. Zdecydowana większość moich studentów to ofiary
nauczycieli matematyki, którzy wyrobili w nich przekonanie, że ta dziedzina nauki
jest dla nich nie do pojęcia. Czasem mam wrażenie, że zamiast kursu statystyki pro-
wadzę kurs zmiany postaw. Na początku wielu studentów twierdzi, że oni niczego,
co jest związane z matematyką, nie są w stanie się nauczyć. Myślę sobie wtedy nie
najlepiej o ich wiedzy psychologicznej. Powinni przecież wiedzieć, że zamiast pyta-
nia „CZY" należy postawić pytanie „JAK". I -jak wynika ze znanego porzekadła
„Kto chce, szuka sposobów, kto nie chce, szuka powodów", należy się zastano-
wić, w jaki sposób zorganizować naukę, aby jak najlepiej odpowiadała naszym pre-
ferencjom poznawczym.
„Statystyka" - to brzmi dla większości humanistów bardzo groźnie. Tym
samym terminem określany jest przedmiot wykładany na matematyce, ekonomii,
zarządzaniu, socjologii, psychologii. Uczy się tam jednak innych rzeczy - na mate-
matyce przypomina to naukę budowy samochodu, na psychologii kurs jazdy samo-
chodem. Człowiek, który zna teorię budowy samochodu może czuć się bezradny, gdy
usiądzie za kierownicą. Dobry kierowca może nie znać takich szczegółów - choć jest
dużo lepiej, jeżeli rozumie ogólne zasady funkcjonowania pojazdu.
Podręcznik jest pisany dla praktyków, a nie teoretyków, i dlatego jest pełen
uproszczeń. Stosując analogię do nauki sztuki kulinarnej, nie będziemy studiować
procesów chemicznych zachodzących podczas duszenia mięsa, a skoncentrujemy się
wyłącznie na heurystykach i algorytmach, jakie trzeba zastosować, aby to mięso
smacz-
nie przyrządzić. Tak jak w rękach kiepskiego kucharza mięso może zostać spalone na
węgiel, tak w rękach kiepskiego badacza ciekawe wyniki empiryczne mogą zostać
niezauważone. Umiejętność stosowania statystyki też wymaga artyzmu. Ale zanim
staną się Państwo artystami w analizowaniu danych, często obarczonych sporym szu-
mem, czeka nas sporo palcówek. Proszę mi zaufać, choć często będą się one wyda-
wały sztuczne, to wykonywanie ćwiczeń ma głębszy sens, niż się Państwu wydaje.
Do nauki statystyki należy podejść jak do nauki języka. Najpierw trzeba na-
uczyć się słówek i sposobu budowania zdań. Wymaga to systematyczności. Części
tych słówek będziemy się uczyć w dwóch językach równocześnie: angielskim i pol-
skim, ponieważ ogólnie przyjęte skróty, takie jak SS na określenie sum kwadratów,
pochodzą od angielskich terminów (SS-sum ofsąuares). Tak jak w każdym języku,
i tu jest sporo synonimów. Przykładowo, prawdopodobieństwo popełnienia błędu I.
rodzaju określane jest jako poziom istotności lub poziom ufności. Symbol /? oznacza
zarówno prawdopodobieństwo popełnienia błędu II rodzaju, jak i standaryzowany
współczynnik regresji itd.
Treści zawarte w podręczniku są maksymalnie uproszczone. Każdy jest w sta-
nie je przyswoić, o ile tylko zechce, tzn. będzie szukał sposobów, a nie powodów.
Trzeba jednak czytać skrypt aktywnie - z ołówkiem, ewentualnie kalkulatorem, spraw-
dzać wszystkie obliczenia po kolei. Tylko aktywność własna może przynieść efek-
ty. Po latach oszczędzania niepotrzebnego wysiłku uczniowi, karierę robi japońska
szkoła nauczania matematyki, która podstawową rolę przypisuje wyuczeniu pew-
Wstęp
nych umiejętności, uzyskanie zaś wglądu jest zadaniem wtórnym. Do tego podejścia
zachęcam Czytelnika. Proszę mi wierzyć - wykonanie ćwiczeń zawartych w pod-
ręczniku jest konieczne. Zostały czasem zostawione puste miejsca po to właśnie,
aby skłonić Czytelnika do sięgnięcia po ołówek. Po każdym rozdziale jest kolorowa
kartka, na której warto zapisać to, co powinniśmy zapamiętać. Inaczej będzie to jak
oglądanie kasety z nauką jazdy samochodem. Oczywiście, że można obejrzeć, ale
warto też usiąść za kierownicą. Rozwiązywanie ćwiczeń w podręczniku jest jak jaz-
da z instruktorem. Przygotuje to Państwa do samodzielnego prowadzenia samocho-
du. Nawet jeżeli jesteśmy przekonani, że zrozumieliśmy co to jest wariancja, błąd
standardowy, etapy testowania hipotez, to prawdziwe ukorzenienie tej wiedzy nastą-
pi dopiero wtedy, gdy samodzielnie przetestujemy kilkadziesiąt hipotez statystycz-
nych. Ćwiczenia zostały tak dobrane, aby było to bardzo proste.
O tym, że przyjęta przeze mnie metoda dydaktyczna jest skuteczna, przekonują
mnie wysokie oceny studentów. Na 318 oceniających mnie w lutym 2003 roku stu-
dentów mediana oceny na pięciopunktowej skali na wymiarach: ciekawy wykład,
kontakt ze słuchaczami, zrozumiałość wykładu wyniosła odpowiednio 4, 5, 4. To
bardzo dobre oceny, biorąc pod uwagę fakt, że gdy wchodzę na salę po raz pierwszy,
studenci patrzą na mnie z wielką niechęcią ze względu na nazwę przedmiotu. Zupeł-
nie inaczej jestem witana na pierwszym wykładzie z psychologii społecznej. Dlatego
cieszą mnie dołączone do ankiet anonimowe uwagi:
ten wykład jest zrozumiały nawet dla „ zatwardziałych humanistów ";
„ dzięki" relacjom moich znajomych statystyka jawiła mi się jako koszmar
jakichkol-
Zgłoś jeśli naruszono regulamin