Statystyka, prognozowanie, ekonometria, data mining Strona Główna
Reklama pqstat.pl
Statystyka, prognozowanie, ekonometria, data mining
Forum miłośników statystyki - Portal Statystyczny

FAQFAQ  SzukajSzukaj  UżytkownicyUżytkownicy  GrupyGrupy  StatystykiStatystyki
RejestracjaRejestracja  ZalogujZaloguj  Chat   Regulamin  Kadra forum
PORTAL STATYSTYCZNY
 Ogłoszenie 
FORUM STATYSTYCZNE MA JUŻ 10 LAT

Znasz statystykę lub ekonometrię, metody prognozowania, data mining i chcesz pomóc w rozwoju forum statystycznego ?
Pisz na: administrator(małpa)statystycy.pl

Rozpoczął swoją działalność portal statystyczny - masz pomysł na jego rozwój ?

Drogi forumowiczu! Zanim napiszesz posta zapoznaj się z regulaminem forum i przedstaw się
The International Year of Statistics (Statistics2013) Smarter Poland Portal statystyczny

Poprzedni temat «» Następny temat

Tagi tematu: Brak tagów.

Test t i założenie normalności rozkładu
Autor Wiadomość
min45 
Szeregowy


Posty: 3
Skąd: Kraków
Wysłany: 2008-11-28, 09:53   Test t i założenie normalności rozkładu

Witam

Jestem początkująca więc być może moje pytanie wyda się banalne, ale proszę o pomoc.
Zamierzam wykonać test t Studenta, żeby porównać mężczyzn i kobiety pod względem pewnej cechy. Czy normalność rozkładu tej cechy mam sprawdzić dla całej grupy, czy osobo dla mężczyzn i kobiet?
Ostatnio zmieniony przez mathkit 2013-04-23, 13:17, w całości zmieniany 2 razy  
 
     
Google

Wysłany:    Reklama google.

 
 
Pearson 
Podporucznik
Pearson



Pomógł: 12 razy
Posty: 199
Skąd: Wrocław
Wysłany: 2008-11-28, 10:11   

Cytat:
Czy normalność rozkładu tej cechy mam sprawdzić dla całej grupy, czy osobo dla mężczyzn i kobiet?


Osobno.
 
     
min45 
Szeregowy


Posty: 3
Skąd: Kraków
Wysłany: 2008-11-28, 11:53   

Dziękuję za szybka odpowiedź.

Rozkłady okazały się odbiegające od rozkładu normalnego. Tak więc chyba powinnam użyć testu Manna-Whitneya. Jednak grupy bardzo różnią się liczebnością - w jednej grupie 120 osób, w drugiej 21. Czy w takim razie ten test będzie odpowiedni?

I może zadam od razu drugie pytanie: założyłam, że test Manna-Whitneya jest odpowiedni. Istotność asymptotyczna (dwustronna) wynosi 0,055. Hipoteza jednak była jednostronna (mężczyźni będą mieć wyższy poziom danej cechy) - czy w takim razie coś powinnam zrobić z tym wynikiem? Używam SPSS i nie zauważyłam tam możliwości wykonania testu jednostronnego.
Ostatnio zmieniony przez mathkit 2013-04-23, 13:18, w całości zmieniany 1 raz  
 
     
cogito 
Podporucznik



Pomógł: 30 razy
Posty: 310
Skąd: Wrocław
Wysłany: 2008-11-28, 13:00   

najlepiej zmien oprogramowanie na takie ktore liczy testy jednostronne

zazwyczaj p-wartosc dla testu jednostronnego to 1-p/2 lub p/2, gdzie p to p-wartosc dla testu dwustronnego
jezeli porownujesz srednie w X i Y, srednia w X jest wieksza od sredniej w Y a Ty
1. testujesz hipoteze alternatywna ze srednia w X > od sredniej w Y to p-wartosc dla testu jednostronnego = p/2
2. testujesz hipoteze alternatywna ze srednia w X < od sredniej w Y to p-wartosc dla testu jednostronnego = 1-p/2

niezawsze tak jest z uwagi na nieciagly rozklad p-wartosci dla testow rangowych, ale dla takich liczebnosci jakie masz mysle ze mozna juz uzyc powyzszych przyblizen

najlepiej jednak jak zmienisz program w ktorym robisz test, oczywiscie polecam pakiet R ;-)
_________________
pozdrawiam
Przemek
www.biecek.pl
 
     
Pearson 
Podporucznik
Pearson



Pomógł: 12 razy
Posty: 199
Skąd: Wrocław
Wysłany: 2008-11-28, 17:36   

Dodam jeszcze jedno, że jeśli hipoteza alternatywna jest kierunkowa, to często można przyjąć hipotezę zerową. Gdy alternatywna jest różna, to niestety mówimy, że nie ma podstaw do jej odrzucenia.
 
     
cogito 
Podporucznik



Pomógł: 30 razy
Posty: 310
Skąd: Wrocław
Wysłany: 2008-11-29, 09:19   

Mysle ze w obu przypadkach powinno sie mowic, ze nie ma podstaw do odrzucenia H0.

Dodam jeszcze, ze dla hipotez kierunkowych czasem wyznacza sie tez tzw. blad III rodzaju, czyli prawdopodobienstwo pomylenia sie ,,w zla strone''
_________________
pozdrawiam
Przemek
www.biecek.pl
 
     
Pearson 
Podporucznik
Pearson



Pomógł: 12 razy
Posty: 199
Skąd: Wrocław
Wysłany: 2008-11-29, 14:02   

Cytat:
Mysle ze w obu przypadkach powinno sie mowic, ze nie ma podstaw do odrzucenia H0.

Jakieś argumenty? Niektóre znam, ale być może powiesz coś nowego.

cogito napisał/a:
tzw. blad III rodzaju, czyli prawdopodobienstwo pomylenia sie ,,w zla strone''

A można się pomylić w dobrą stronę :-) . No offence.
 
     
cogito 
Podporucznik



Pomógł: 30 razy
Posty: 310
Skąd: Wrocław
Wysłany: 2008-11-29, 15:27   

Cytat:
Dodam jeszcze jedno, że jeśli hipoteza alternatywna jest kierunkowa, to często można przyjąć hipotezę zerową.


W testowaniu hipotez hipotezy traktowane sa asymetrycznie, nie ma tu znaczenia czy sa one kierunkowe czy dwustronne.

Asymetrycznosc polega na tym ze zbierane sa argumenty za tym, ze hipoteza zerowa jest nieprawdziwa, jezlei sie uda to odrzucamy hipoteze zerowa jezeli sie nie uda to mozemy tylko powiedziec ze nie mamy podstaw aby hipoteze zerowa odrzucic.

Najprostszy przyklad: mamy malo obserwacji przez co test nie daje nam podstaw do odrzucenia hipotezy zerowej. Mozemy przypuszczac ze ten brak podstaw wynika z malej liczby obserwacji.

Czy to test dwustronny, jednostronny czy ,,wielostronny'' nie ma znaczenia.

Cytat:
tzw. blad III rodzaju, czyli prawdopodobienstwo pomylenia sie ,,w zla strone''


chodzilo mi oczywiscie o blad polegajacy na uznaniu ze x>y pomimo ze x<y
w odroznienia od bledu polegajacym na uznaniu ze x>y pomimo ze x=y
_________________
pozdrawiam
Przemek
www.biecek.pl
 
     
Pearson 
Podporucznik
Pearson



Pomógł: 12 razy
Posty: 199
Skąd: Wrocław
Wysłany: 2008-11-29, 22:05   

cogito napisał/a:
W testowaniu hipotez hipotezy traktowane sa asymetrycznie, nie ma tu znaczenia czy sa one kierunkowe czy dwustronne.

Znaczenie jest bardzo duże. Przykładowo, jeśli chcesz skonstruować test jednostajnie najmocniejszy, to dla hipotezy alternatywnej:
na ogół on nie istnieje, natomiast dla alternatywnej postaci: zazwyczaj tak. I w takim teście możemy przyjąć H_0.

cogito napisał/a:
Asymetrycznosc polega na tym ze zbierane sa argumenty za tym, ze hipoteza zerowa jest nieprawdziwa, jezlei sie uda to odrzucamy hipoteze zerowa jezeli sie nie uda to mozemy tylko powiedziec ze nie mamy podstaw aby hipoteze zerowa odrzucic.

To prawda, ale dotyczy ona testów ... jakich? No właśnie. I jeszcze pytanie: po co nam błąd drugiego rodzaju?
Ostatnio zmieniony przez mathkit 2013-04-23, 13:35, w całości zmieniany 1 raz  
 
     
cogito 
Podporucznik



Pomógł: 30 razy
Posty: 310
Skąd: Wrocław
Wysłany: 2008-11-30, 11:28   

Nie widze zwiazku z istnieniem testu jednostajnie najmocniejszego a terminologia stosowana przy przyjmowaniu lub odrzucaniu hipotez.
Nie widze tez spojnosci gdy najpierw piszesz o testach jednostajnie najmocniejszych a pozniej pytasz po co blad drugiego rodzaju.
_________________
pozdrawiam
Przemek
www.biecek.pl
 
     
Pearson 
Podporucznik
Pearson



Pomógł: 12 razy
Posty: 199
Skąd: Wrocław
Wysłany: 2008-11-30, 13:10   

Cytat:
Nie widze zwiazku z istnieniem testu jednostajnie najmocniejszego a terminologia stosowana przy przyjmowaniu lub odrzucaniu hipotez.

To szkoda. W takim teście możesz przyjąć , a np. w testach istotności nie.

cogito napisał/a:
Nie widze tez spojnosci gdy najpierw piszesz o testach jednostajnie najmocniejszych a pozniej pytasz po co blad drugiego rodzaju.

To było dodatkowe pytanie do tej całej układanki. Po co ci błąd II rodzaju i gdzie go wykorzystujesz?
Ostatnio zmieniony przez mathkit 2013-04-23, 13:36, w całości zmieniany 1 raz  
 
     
ronaldg9 
Szeregowy


Posty: 1
Skąd: Annopol
Ostrzeżeń:
 1/3/6
Wysłany: 2013-04-17, 10:47   Proszę o pomoc w rozwiązaniu

Witam. Chciałbym serdecznie prosić o pomoc w zadaniu rozwiązywanym w programie sas. Dotyczy ono prób niezależnych, którymi są dwie marki pojazdów ALFA I OMEGA. Poniżej opis:

Problem realizowany przez nas jest związany z oceną sprawności funkcjonowania samochodów marek ALFA i OMEGA. Działanie samochodów wyrażone jest w ocenach w skali od 0 do 10 punktów. Samochody z większą oceną punktową mają lepszą jakość funkcjonowania.
2. Opis danych do analizy
Zmienne niezbędne do analizy to ALFA i OMEGA. Są to wybrane losowo egzemplarze dwóch konkurencyjnych marek pojazdów. Każdy z wybranych egzemplarzy przeszedł różne specjalistyczne testy, w wyniku czego otrzymał określoną ocenę. Liczebność próby ALFA wynosi 120, natomiast liczebność próby OMEGA wynosi 140.

Zadanie wykonywane w Programie SAS przebiegało następująco:

3. Testowanie normalności rozkładu zmiennych opisujących funkcjonowanie pojazdu
Hipoteza H0: samochody marki ALFA z próby mają lepszą sprawność funkcjonowania niż samochody marki OMEGA z próby
Hipoteza alternatywna H1: samochody marki ALFA z próby nie maja lepszej sprawności funkcjonowania niż samochody marki OMEGA z próby

Przyjęty poziom istotności α = 0,05


• dla samochodów marki ALFA

Parametry dla rozkładu normalnego
Parametr Symbol Ocena
Średnia mi 5.515583
Odch. std. sigma 0.841829
Testy dopasowania dla rozkładu normalnego
Test Statystyka Wartość p
Kołmogorow-Smirnow D 0.04273592 Pr. > D >0.150
Cramer-von Mises W-kwadr. 0.03054400 Pr. > W-kwadr. >0.250
Anderson-Darling A-kwadr. 0.24679546 Pr. > A-kwadr. >0.250


Rezultaty analizy dla testu Kołmogorowa-Smirnowa
Wartości oszacowanych z próby parametrów rozkładu normalnego:
• średnia z próby = 5.52
• odchylenie standardowe =0.84
• wartość statystyki testowej= 0,04
• prawdopodobieństwo testowe: >0,15



• dla samochodów marki OMEGA

Parametry dla rozkładu normalnego
Parametr Symbol Ocena
Średnia mi 8.2745
Odch. std. sigma 2.720404

Testy dopasowania dla rozkładu normalnego
Test Statystyka Wartość p
Kołmogorow-Smirnow D 0.03795036 Pr. > D >0.150
Cramer-von Mises W-kwadr. 0.02349056 Pr. > W-kwadr. >0.250
Anderson-Darling A-kwadr. 0.20350582 Pr. > A-kwadr. >0.250

Rezultaty analizy dla testu Kołmogorowa-Smirnowa
Wartości oszacowanych z próby parametrów rozkładu normalnego:
• średnia z próby = 8.27
• odchylenie standardowe =2.72
• wartość statystyki testowej= 0,04
• prawdopodobieństwo testowe: >0,15


Podać zasadność prowadzenia tych testów.

4. Testowanie istotności różnic między średnimi dwóch populac
Marka N Średnia Odch. std. Błąd std. Minimum Maksimum
ALFA 120 5.5156 0.8418 0.0768 3.5600 7.7700
OMEGA 140 8.2745 2.7204 0.2299 1.6300 14.7400
Różn. (1-2) -2.7589 2.0770 0.2584

Marka Metoda Średnia 95% prz. ufn. średniej Odch. std. 95% prz. ufn. odch. std.
ALFA 5.5156 5.3634 5.6678 0.8418 0.7471 0.9643
OMEGA 8.2745 7.8199 8.7291 2.7204 2.4347 3.0826
Różn. (1-2) Wariancji sumarycznej -2.7589 -3.2677 -2.2501 2.0770 1.9122 2.2731
Różn. (1-2) Satterthwaite'a -2.7589 -3.2375 -2.2804

Metoda Wariancje DF Wartość t Pr. > |t|
Wariancji sumarycznej Równe 258 -10.68 <.0001
Satterthwaite'a Nierówne 169.32 -11.38 <.0001

Równość wariancji
Metoda DF liczn. DF mian. Wartość F Pr. > F
Folded F 139 119 10.44 <.0001



5. Wnioski wynikające z badań
Sformułować wnioski wynikające z przeprowadzonych analiz.

Muszę zrobić jeszcze polecenia które są napisane czerwonym kolorem, ale nie wiem jak.. Bardzo proszę o pomoc:)
 
 
     
mathkit 
Major



Pomógł: 46 razy
Wiek: 34
Posty: 1301
Skąd: Katowice
Wysłany: 2013-04-23, 13:37   

Cytat:
Podać zasadność prowadzenia tych testów


Żeby móc stosować testy parametryczne na średnie, musisz najpierw sprawdzić czy próby pochodzą z rozkładu normalnego.
 
 
     
kasiora 
Szeregowy


Posty: 2
Skąd: Kalisz
Wysłany: 2016-01-11, 12:09   

Witam,
Przygotowuję się do napisania pracy zaliczeniowej, proszę o pomoc czy moja interpretacja wyników jest prawidłowa - Klasyczna Metoda Najmnieszych Kwadratów. Opracowałam model panelowy dotyczący wyników 27 krajów UE w roku 2009 i 2015. (W 2009 nie było Chorwacji w UE więc z 2015 usunęłam kraj -nie wiem mogę zostawić lukę w danych. Do wyliczeń posłużyłam się programem Gretl, dane panelowe - stos danych przekrojowych- 27 jednostek przekroj. w 2 przekrojach czasowych. Proszę o pomoc
Model 2: Estymacja KMNK, wykorzystane obserwacje 1:01-2:27 (N = 54)
Zmienna zależna (Y): TR

Współczynnik Błąd stand. t-Studenta wartość p
const 15,4149 6,10941 2,5231 0,0149 **
GOV 0,244367 0,0956915 2,5537 0,0138 **
dec 0,410694 0,133052 3,0867 0,0033 ***
know 0,728228 0,362628 2,0082 0,0500 *

Średn.aryt.zm.zależnej 50,90741 Odch.stand.zm.zależnej 11,15968
Suma kwadratów reszt 2762,611 Błąd standardowy reszt 7,433183
Wsp. determ. R-kwadrat 0,581457 Skorygowany R-kwadrat 0,556344
F(3, 50) 23,15399 Wartość p dla testu F 1,55e-09
Logarytm wiarygodności −182,8663 Kryt. inform. Akaike'a 373,7325
Kryt. bayes. Schwarza 381,6885 Kryt. Hannana-Quinna 376,8008

Równanie modelu
^TR = 15,4 + 0,244*GOV + 0,411*dec + 0,728*know
(6,11) (0,0957) (0,133) (0,363)

Interpretacja

Jeżęli Gov wzrośnie o 1 pkt % to Tr wzrośnie 0 0,244 (przy założeniu cetersis paribus pozostałych elementów równania)

Jeżęli DEC wzrośnie o 1 pkt % to Tr wzrośnie 0 0,411 (przy założeniu cetersis paribus pozostałych elementów równania)

Jeżęli KNOW wzrośnie o 1 pkt % to Tr wzrośnie 0 0,728 (przy założeniu cetersis paribus pozostałych elementów równania)


Wsp. determ. R-kwadrat 0,581457 - 58% zmienności zostało wyjaśnione przez model.
Błąd Standardowy reszt – wartości rzeczywiste TR odchylają się średnio od wartości rzeczywistych 0 7,433183
Istotność zmiennych
Przyjmujemy poziom istotności α -5% - wyniki wskazują, że zmienne GOV i DEC mają istotny wpływ na zmienną objaśnianą, natomiast zmienna KNOW brak istotnego wpływu na zmienną objaśnianą – w tym przypadku poziom istotności 10 % .Zastanawiam się czy ze względu na to że dane dotyczą badania opinii (socjologiczne) –zgodnie z literaturą nie podnieść poziomu istotności do 10%.


Test istotności zmiennej
H0 – parametr nie istotny w modelu
H1 – parametr istotnie wpływa na model
t(50)
prawostronne prawdopodobieństwo = 0,1
prawdopodobieństwo dopełnienia = 0,9
dwustronny obszar krytyczny = 0,2

Krytyczna wart. = 1,29871
Wszystkie wartości t-studenta uzyskały wartość powyżej 1,29871 co oznacza, że wszystkie parametry modelu istotnie wpływają na model, w związku z tym nie usuwam z modelu parametru KNOW.
Badanie heterosdedastyczności
H0 – model jest homoskedastyczny (prawidłowa postać modelu)
H1 – model jest heteroskedastyczny ( nieprawidłowa postać modelu)
Test White'a na heteroskedastyczność reszt (zmienność wariancji resztowej) -
Hipoteza zerowa: heteroskedastyczność reszt nie występuje
Statystyka testu: LM = 4,55727
z wartością p = P(Chi-kwadrat(9) > 4,55727) = 0,871071
0,87> 0,05 model jest homoskedastyczny (postać modelu prawidłowa)

Ocena współliniowości VIF(j) - czynnik rozdęcia wariancji

VIF (Variance Inflation Factors) - minimalna możliwa wartość = 1.0
Wartości > 10.0 mogą wskazywać na problem współliniowości - rozdęcia wariancji

GOV 2,073
dec 2,000
know 1,115

VIF(j) = 1/(1 - R(j)^2), gdzie R(j) jest współczynnikiem korelacji wielorakiej
pomiędzy zmienną 'j' a pozostałymi zmiennymi niezależnymi modelu.

Własności macierzy X'X:

1-norm = 328537
Wyznacznik = 8,8838875e+011
Wskażnik uwarunkowania macierzy CN = 4,3827453e-006
Brak współliniowości i ryzyka rozdęcia wariancji.

test RESET na specyfikację -
Hipoteza zerowa: specyfikacja poprawna
Statystyka testu: F(2, 48) = 2,55728
z wartością p = P(F(2, 48) > 2,55728) = 0,0880367
0,0880367>0,05 specyfikacja modelu poprawna

Test na normalność rozkładu reszt -
Hipoteza zerowa: składnik losowy ma rozkład normalny
Statystyka testu: Chi-kwadrat(2) = 10,9307
z wartością p = 0,00423089 <α odrzucamy hipotezę zerową o normalności rozkładu reszt
Czy to nam dyskwalifikuje model jako poprawny, czy muszę jeszcze przeprowadzić jakieś wyliczenia ?
Nie wiem czy dany model może być podstawą do napisania pracy zaliczeniowej.Nie chciałabym służyć jako przykład braku kompetencji.

Dziękuję za pomoc.
Kasia
 
     
tojo 
Szeregowy


Posty: 1
Skąd: Kraków
Wysłany: 2016-04-04, 19:49   Re: Test t i założenie normalności rozkładu

min45 napisał/a:
Witam
Jestem początkująca więc być może moje pytanie wyda się banalne, ale proszę o pomoc.
Zamierzam wykonać test t Studenta, żeby porównać mężczyzn i kobiety pod względem pewnej cechy. Czy normalność rozkładu tej cechy mam sprawdzić dla całej grupy, czy osobo dla mężczyzn i kobiet?


Witam,
w nawiązaniu do pierwszego posta rozpoczynającego ten wątek chciałbym prosić o wyjaśnienie dlaczego w teście t wymagamy aby rozkład cech był zgodny z rozkładem normalnym. W jakim celu konieczny jest nam rozkład normalny testowanej cechy? Czy można w jakiś prosty sposób wyjaśnić konieczność tego założenia?
Z góry dziękuję
 
     
Wyświetl posty z ostatnich:   
Odpowiedz do tematu
Nie możesz pisać nowych tematów
Nie możesz odpowiadać w tematach
Nie możesz zmieniać swoich postów
Nie możesz usuwać swoich postów
Nie możesz głosować w ankietach
Nie możesz załączać plików na tym forum
Możesz ściągać załączniki na tym forum
Dodaj temat do Ulubionych zakładek(IE)
Wersja do druku

Skocz do:  

Podobne Tematy
Temat Autor Forum Odpowiedzi Ostatni post
Brak nowych postów Przyklejony: Założenie o normalności rozkładu zmiennej Y|X
Dyskusja
sylwia Teoria estymacji 12 2008-09-19, 15:48
Pearson
Brak nowych postów Przyklejony: przybliżenie rozkładem Poissona a rozkładem normalnym
Tw. Poissona contra Tw. de Moivre'a - Laplace'a
troll1 Teoria i rachunek prawdopodobieństwa 5 2007-03-31, 11:36
duraCELL
Brak nowych postów Przyklejony: Testowanie normalności rozkładu
dree Testowanie hipotez statystycznych 1 2006-11-07, 20:03
mathkit
Brak nowych postów Przyklejony: Normalność rozkładu reszt w modelu ARMA
haver Modelowanie ekonometryczne 3 2009-05-24, 10:30
Pearson
Brak nowych postów Przyklejony: Test normalności Shapiro-Wilka
Prośba o pomoc w zastosowaniu/wytłumaczeniu
Jackiller Testowanie hipotez statystycznych 110 2014-02-22, 09:55
Seeman

Ideą przyświecającą istnieniu forum statystycznego jest stworzenie możliwości wymiany informacji, poglądów i doświadczeń osób związanych ze statystyką, mierzenie się z różnego rodzaju problemami statystycznymi i aktuarialnymi. Poruszane problemy: Statystyka w badaniach sondażowych rynku, metody reprezentacyjne, Teoria i rachunek prawdopodobieństwa, statystyka opisowa, teoria estymacji, testowanie hipotez statystycznych, ekonometria, prognozowanie, metody data mining.
Copyright (C) 2006-2015 Statystycy.pl
Powered by phpBB modified by Przemo © 2003 phpBB Group
Strona wygenerowana w 0,19 sekundy. Zapytań do SQL: 30