wtorek, 7 listopada 2017

Użycie testów statystycznych w Excelu


More Website Templatesat TemplateMonster.com!








Testychi-kwadrat


=var.s;    =frequency z górnym przedziałem;    =stdev.s <odchylenie>;

test z  - czy wynik jest mnijeszy/większy od średniej
NAJPIERW SPRAWDŹ CZY WARIANCJE SĄ RÓWNE PRZED TESTEM T; H0 równe, p<0,05 odrzut
test f - czy wariancje są równe
test t dla spaorwanych - przed po
h0 ogólnie- brak związku/nie wpływa istotnie, rozkład jednostajny
oszacuj wartość oczekiwaną - lewa/prawa strona przedziału, odchylenie, błąd stand
test chi zgodn ośći- porówananie rozkładu otrzymanego z teoretycznym; porównanie wyników z teoretycznymi, np kostka i wyciągnięcie wniosków

wynik testu chi np 10
chisq.inv = y
tablice chi dla poziom istotności np 0,05, n-1 = 100
10<100 brak podstaw do odrzutu h0, LUB x>poziom istotności  brak podstaw too
chi niezależności - tabela -> czy zmierzone wartości są od siebie zależne
Rozkład poissona = poisson.dist   służy do prognozowania liczby zdarzeń w czasie; oblicz prawdopodobieństwo podanych zdarzeń; co najwyżej lub dokładnie
Test t H0: nie wpływa istotnie H1: wpływa istotnie
np. wychodzi odrzut H1, przyjmujemy więc H1 (m1/=/m2). Wyniki brak związku, bo rozkład wyników, te średnie nie są równe. Czyli liczba wyleczonych lekiem i próby kontrolnej nie są powiązane, <ale nie chodzi o sparowanie przed-po), więc lek działa.

Są to najczęściej wykorzystywane testy podczas analizowania ankiet. Warto uzupełniać testy, testami V Kramera lub Phi Yula, gdyż sam test daję nam tylko informację czy dana zależność występuję, natomiast nie informuję nas o sile wykazanej zależności. W teście chi kwadrat porównujemy wartości obserwowane z wartościami oczekiwanymi. Wzór tego testu ma postać:
*
*źródło Wikipedia
Gdzie:
O – wartość obserwowana
E – wartość oczekiwana
Bardzo istotne jest by wartość E była większa od 5, jeśli ten warunek nie nastąpi trzeba wprowadzać odpowiednie poprawki do testu chi kwadrat, a najlepiej jest połączyć tak grupy by uzyskać wartości większe niż 5.

Test chi kwadrat zgodności


Stosowany w celu sprawdzenia równoliczności grup oraz gdy porównujemy doświadczalny (empiryczny) rozkład zmiennej z rozkładem teoretycznym.
Przykałd: 
Zadano pytanie 100 ankietowanym, czy opłacają abonament telewizyjny. W fikcyjnym świecie rozkład odpowiedzi przedstawiałby się w ten sposób, że 50% osób opłacałoby abonament a 50% nie. Jednakże prawdziwy rozkład odpowiedzi przedstawiał nieco inne proporcje: 20 osób płaciło a 80 nie uiszczało opłat.
Hipoteza zerowa brzmi:
Nie ma różnic pomiędzy liczbą osób uiszczających abonament a liczbą osób niepłacących.
Hipoteza alternatywna brzmi:
Istnieją różnicę pomiędzy liczbą osób nieopłacających, a opłacających abonament.
Teraz spójrzmy na wzór, musimy od liczby osób, które opłacały abonament (20) odjąć liczbę osób, która abonament opłacałaby teoretycznie (50) a następnie podnieść uzyskaną różnicę do kwadratu. Wynik dzielimy przez wartość oczekiwaną (50).

Test chi kwadrat niezależności


Stosowany w celu sprawdzenia czy dwie zmienne są niezależne od siebie (brak korelacji). Używany w przypadku zmiennych o charakterze nominalnym (jakościowym). Posłużmy się przykładem, aby zaprezentować jak obliczyć test chi kwadrat niezależności.
Zapytano dorosłych respondentów o swoje wykształcenie, oraz o to czy palą papierosy. Hipoteza zerowa brzmi: wykształcenie ankietowanych nie ma wpływu na palenie papierosów (brak zależności między zmiennymi), hipoteza alternatywna brzmi: wykształcenie ankietowanych miało wpływ na palenie papierosów (zmienne są zależne, korelacja występuję). Rozkład odpowiedzi przedstawia poniższa tabela:





Następnie uzyskane ilorazy sumujemy.

18 + 18 = 36

Uzyskany wynik to nasza wartość statystyki chi kwadrat.
Aby stwierdzić czy uzyskany wynik jest istotny, musimy obliczyć 
stopnie swobody z następującego wzoru:
df = (r – 1) * (c – 1)

gdzie:
r i c to ilość poziomów zmiennych, dla których obliczamy chi kwadrat.
W naszym analizowanym przykładzie, występuję tylko jedna zmienna 
(opłata abonamentu), która przyjmuje dwa poziomy (opłacany abonament, nieopłacany abonament).
df = (2-1) = 1

Przyjęliśmy poziom istotności alfa = 0,05. Naszą wartość krytyczną chi kwadrat wyszukujemy z tablic.
 Na skrzyżowaniu kolumny poziomu alfa z wierszem stopni swobody odczytujemy wartość, 
która w naszym przykładzie wynosi 3,841. Ponieważ nasza wartość statystyki jest większa 
od wartości tablicowej, odrzucamy hipotezę zerową. Istnieją różnicę pomiędzy liczbą 
osób opłacających a nieopłacających abonament, przy istotności alfa równej 0,05. 
Warto jeszcze zauważyć że nasz wynik jest również istotny dla poziomu alfa 0,005.
 Im mniejszy poziom istotności założymy, tym mniejsze prawdopodobieństwo popełnienia błędu I rodzaju.

sumujemy.

18 + 18 = 36

Uzyskany wynik to nasza wartość statystyki chi kwadrat.
Aby stwierdzić czy uzyskany wynik jest istotny, musimy obliczyć 
stopnie swobody z następującego wzoru:
df = (r – 1) * (c – 1)

gdzie:
r i c to ilość poziomów zmiennych, dla których obliczamy chi kwadrat.
W naszym analizowanym przykładzie, występuję tylko jedna zmienna 
(opłata abonamentu), która przyjmuje dwa poziomy (opłacany abonament, nieopłacany abonament).
df = (2-1) = 1

Przyjęliśmy poziom istotności alfa = 0,05. Naszą wartość krytyczną chi kwadrat wyszukujemy z tablic.
 Na skrzyżowaniu kolumny poziomu alfa z wierszem stopni swobody odczytujemy wartość, 
która w naszym przykładzie wynosi 3,841. Ponieważ nasza wartość statystyki jest większa 
od wartości tablicowej, odrzucamy hipotezę zerową. Istnieją różnicę pomiędzy liczbą 
osób opłacających a nieopłacających abonament, przy istotności alfa równej 0,05. 
Warto jeszcze zauważyć że nasz wynik jest również istotny dla poziomu alfa 0,005.
 Im mniejszy poziom istotności założymy, tym mniejsze prawdopodobieństwo popełnienia błędu I rodzaju.

 sumujemy.

18 + 18 = 36

Uzyskany wynik to nasza wartość statystyki chi kwadrat.
Aby stwierdzić czy uzyskany wynik jest istotny, musimy obliczyć 
stopnie swobody z następującego wzoru:
df = (r – 1) * (c – 1)

gdzie:
r i c to ilość poziomów zmiennych, dla których obliczamy chi kwadrat.
W naszym analizowanym przykładzie, występuję tylko jedna zmienna 
(opłata abonamentu), która przyjmuje dwa poziomy (opłacany abonament, nieopłacany abonament).
df = (2-1) = 1

Przyjęliśmy poziom istotności alfa = 0,05. Naszą wartość krytyczną chi kwadrat wyszukujemy z tablic.
 Na skrzyżowaniu kolumny poziomu alfa z wierszem stopni swobody odczytujemy wartość, 
która w naszym przykładzie wynosi 3,841. Ponieważ nasza wartość statystyki jest większa 
od wartości tablicowej, odrzucamy hipotezę zerową. Istnieją różnicę pomiędzy liczbą 
osób opłacających a nieopłacających abonament, przy istotności alfa równej 0,05. 
Warto jeszcze zauważyć że nasz wynik jest również istotny dla poziomu alfa 0,005.
 Im mniejszy poziom istotności założymy, tym mniejsze prawdopodobieństwo popełnienia błędu I rodzaju.

sumujemy.

18 + 18 = 36

Uzyskany wynik to nasza wartość statystyki chi kwadrat.
Aby stwierdzić czy uzyskany wynik jest istotny, musimy obliczyć 
stopnie swobody z następującego wzoru:
df = (r – 1) * (c – 1)

gdzie:
r i c to ilość poziomów zmiennych, dla których obliczamy chi kwadrat.
W naszym analizowanym przykładzie, występuję tylko jedna zmienna 
(opłata abonamentu), która przyjmuje dwa poziomy (opłacany abonament, nieopłacany abonament).
df = (2-1) = 1

Przyjęliśmy poziom istotności alfa = 0,05. Naszą wartość krytyczną chi kwadrat wyszukujemy z tablic.
 Na skrzyżowaniu kolumny poziomu alfa z wierszem stopni swobody odczytujemy wartość, 
która w naszym przykładzie wynosi 3,841. Ponieważ nasza wartość statystyki jest większa 
od wartości tablicowej, odrzucamy hipotezę zerową. Istnieją różnicę pomiędzy liczbą 
osób opłacających a nieopłacających abonament, przy istotności alfa równej 0,05. 
Warto jeszcze zauważyć że nasz wynik jest również istotny dla poziomu alfa 0,005.
 Im mniejszy poziom istotności założymy, tym mniejsze prawdopodobieństwo popełnienia błędu I rodzaju.sumujemy.

18 + 18 = 36

Uzyskany wynik to nasza wartość statystyki chi kwadrat.
Aby stwierdzić czy uzyskany wynik jest istotny, musimy obliczyć 
stopnie swobody z następującego wzoru:
df = (r – 1) * (c – 1)

gdzie:
r i c to ilość poziomów zmiennych, dla których obliczamy chi kwadrat.
W naszym analizowanym przykładzie, występuję tylko jedna zmienna 
(opłata abonamentu), która przyjmuje dwa poziomy (opłacany abonament, nieopłacany abonament).
df = (2-1) = 1

Przyjęliśmy poziom istotności alfa = 0,05. Naszą wartość krytyczną chi kwadrat wyszukujemy z tablic.