Statystyka, prognozowanie, ekonometria, data mining Strona Główna
Reklama pqstat.pl
Statystyka, prognozowanie, ekonometria, data mining
Forum miłośników statystyki - Portal Statystyczny

FAQFAQ  SzukajSzukaj  UżytkownicyUżytkownicy  GrupyGrupy  StatystykiStatystyki
RejestracjaRejestracja  ZalogujZaloguj  Chat   Regulamin  Kadra forum
PORTAL STATYSTYCZNY
 Ogłoszenie 
FORUM STATYSTYCZNE MA JUŻ 10 LAT

Znasz statystykę lub ekonometrię, metody prognozowania, data mining i chcesz pomóc w rozwoju forum statystycznego ?
Pisz na: administrator(małpa)statystycy.pl

Rozpoczął swoją działalność portal statystyczny - masz pomysł na jego rozwój ?

Drogi forumowiczu! Zanim napiszesz posta zapoznaj się z regulaminem forum i przedstaw się
The International Year of Statistics (Statistics2013) Free statistics help forum. Discuss statistical research, statistical consulting Smarter Poland Portal statystyczny

Poprzedni temat «» Następny temat

Tagi tematu: analiza wariancji, anova

ANOVA
Autor Wiadomość
mathkit 
Major



Pomógł: 46 razy
Wiek: 34
Posty: 1301
Skąd: Katowice
  Wysłany: 2006-11-30, 09:40   ANOVA

Zainspirowany rozmową z pewnym doktorantem technologii żywności, przedstawiam dwa najważniejsze założenia ANOVA oraz konsekwencje ich niespełnienia (cytowane za Statsoft Polska).

Założenie 1. Zakłada się, że zmienna zależna jest wyrażona przynajmniej na skali przedziałowej . Ponadto zmienna zależna powinna podlegać rozkładowi normalnemu w obrębie grup.

Konsekwencje naruszenia założeń.
Test F jest w znacznym stopniu odporny na odchylenia od normalności (patrz Lindman, 1974). Jeśli kurtoza jest większa od 0, wówczas wartość F zmierza do małych wartości i nie możemy odrzucić hipotezy zerowej, nawet jeśli nie jest prawdziwa. Przypadek przeciwny występuje w sytuacji gdy wartość kurtozy jest mniejsza od 0. Skośność rozkładu zazwyczaj nie ma znacznego wpływu na wartość statystyki F. Jeśli liczność n na komórkę jest wystarczająco duża, wówczas odchylenia od rozkładu normalnego nie mają w ogóle znaczenia ze względu na centralne twierdzenie graniczne, zgodnie z którym rozkład średnich z próby zmierza do rozkładu normalnego, niezależnie od rozkładu zmiennej w populacji.


Szczegółowe omówienie elastyczności statystyki testu F można znaleźć u Boxa i Andersona (1955) lub u Lindmana (1974).

Założenie 2. Zakłada się, że wariancje w obrębie różnych grup układu są sobie równe; założenie to jest określane jako założenie o jednorodności (równości, homogeniczności) wariancji. Przypomnijmy sobie, że wariancję błędu obliczamy dodając sumy kwadratów w obrębie grup. W przypadku gdy wariancje w dwóch grupach różnią się pomiędzy sobą, wówczas ich dodawanie nie jest właściwe i nie daje oszacowania wspólnej wariancji wewnątrzgrupowej (ponieważ nie istnieje wspólna wariancja).

Konsekwencje naruszenia założeń. Lindman (1974) pokazał, że statystyka F jest całkowicie odporna na naruszenia tego założenia (problem niejednorodności wariancji; patrz także Box, 1954a, 1954b, Hsu, 1938).

Szczególny przypadek: skorelowanie średnich i wariancji. W pewnym przypadku statystyka F może być jednak bardzo myląca, mianowicie wtedy, gdy średnie i wariancje w obrębie komórek układu są ze sobą skorelowane. Wyjaśnijmy, dlaczego jest to niebezpieczne naruszenie założenia. Wyobraźmy sobie, że mamy 8 komórek w układzie przy czym 7 ma równe średnie natomiast jedna ma średnią znacznie wyższą. Statystyka F może nam sugerować istotny statystycznie wpływ. Jednakże przypuśćmy, że w komórce z najwyższą średnią występuje również dużo większa wariancja, tzn. że średnie i wariancje są skorelowane (im wyższa średnia, tym większa wariancja). W takim przypadku wysoka średnia w jednej komórce jest rzeczywiście niepewna, ponieważ oznacza występowanie dużej wariancji. Jednakże ze względu na to, że ogólna statystka F jest oparta na oszacowaniu połączonej wariancji w obrębie komórki wysoka średnia jest traktowana jako istotnie różna od innych, kiedy w rzeczywistości nie byłaby w ogóle istotnie różna, gdyby oprzeć test na wariancji wewnątrzkomórkowej jedynie w danej komórce.

Taki przypadek (tj. wysoka średnia oraz duża wariancja w jednej komórce) pojawia się często w sytuacji, gdy pojawiają się odstające obserwacje. Jeden lub dwa skrajne przypadki w komórce liczącej tylko 10 przypadków mogą znacznie obciążyć średnią, a także znacznie zwiększyć wariancję.
 
 
     
Google

Wysłany:    Reklama google.

 
 
emulka 
Szeregowy


Posty: 9
Skąd: Kraków
  Wysłany: 2007-09-12, 08:43   zapytanie odnośnie anovy

witam

-mam pytanie odnośnie ANOVY
-pisze prace mgr,przebadałam 31 osób
-po badaniach okazało się ze mam użyć metody ANOVA
-podzieliłam moja grupę na 3 podgrupy(16osób,7 i 8)i miedzy nimi zbadałam istotność różnic między średnimi w badanych skalach
-mam wątpliwość co do sensu wyników,czy naprawdę sa one istotne jeśli badane podgrupy były tak małe?????
-promotor powiedział żebym zastosowała ta metodę,ale jak wybronię sie przed recenzentem jesli powie ze badania na takiej ilosci osób sa nieistotne????niby badania spałniają ogólny warunek min 30 osób ale chyba nie do tej metody???
-proszę pilnie o pomoc!!!

Pozdrawiam
 
     
mathkit 
Major



Pomógł: 46 razy
Wiek: 34
Posty: 1301
Skąd: Katowice
Wysłany: 2007-09-12, 10:35   

Spokojnie mogą być tutaj takie liczebności podprób.

Cytat:
podzieliłam moja grupe na 3 podgrupy(16osób,7 i 8)


Przypominam zatem podstawowe założenia analizy wariancji:

Założenie 1: Analizowana zmienna zależna jest mierzalna w skali co najmniej przedziałowej
Założenie 2: Próba została pobrana z populacji w sposób losowy (I zasada randomizacji)
Założenie 3: Elementy (osoby) z próby zostały przydzielone w sposób losowydo poszczególnych k porównywanych grup (II zasada randomizacji).
Założenie 4: Wszystkie pomiary otrzymane od jednostek eksperymentalnych (osób) są niezależne.
Andrzej Stanisz: "Przystępny kurs statystyki" t.II
Mam nadzieję że przeprowadziłaś to badanie spełniając te podstawowe założenia :mrgreen: , bo jezeli nie to kierunek zniekształceń statystyki F nie jest znany....

Ponieważ u Ciebie podpróby nie są równoliczne, więc większą rolę odgrywają założenia normalności rozkładu w obrębie prób ( test Shapiro Wilka ) oraz jednorodności wariancji w obrębie prób ? Jakie tam uzyskałaś wyniki ?
 
 
     
emulka 
Szeregowy


Posty: 9
Skąd: Kraków
Wysłany: 2007-09-12, 11:23   

Bardzo dziękuje za szybką odpowiedz:)
Nie jestem ekspertem wiec jeśli chodzi o całą procedurę Anova pomógł mi kolega.

Jeśli chodzi o założenia dotyczące jednorodności wariancji i normalności rozkładu zapewnił mnie że z pewnościa te założenia są spelnione.

Mam jeszcze pytanie odnosnie samego przedstawienia wyników:
-czy wystarczy przedstawić wyłącznie efekt koncowy w postaci wyresów interackcji w oprciu o testy post-hoc z odpowiednim komentarzem???
-czy warto może podac jakies tabele z wczesniejszych obliczeń???
W kazdym razie bardzo dziekuje za odpowiedz:))
Podrawiam
 
     
mathkit 
Major



Pomógł: 46 razy
Wiek: 34
Posty: 1301
Skąd: Katowice
Wysłany: 2007-09-12, 12:34   

Cytat:
Jeśli chodzi o założenia dotyczace jednorodności wariancji i normalności rozkładu zapewnił mnie że z pewnościa te założenia są spelnione.


Z pewnością to człowiek umrze :mrgreen: a ja zalecam dołączanie wyników testów, które potwierdzają zasadność stosowania ANOVY.

Testy te muszą być przeprowadzone inaczej w przypadku znacznych odchyleń (na przykład znaczna skośność rozkładu) wyniki mogą być zaburzone.
 
 
     
emulka 
Szeregowy


Posty: 9
Skąd: Kraków
  Wysłany: 2007-09-12, 15:31   

dzięki:):)
Przyjrzę sie wszystkim tabelom raz jeszcze:):)

[ Dodano: 2007-09-12, 17:29 ]
a mam jeszcze wątpliwość.
Czy w przypadku gdy grupy nie są równoliczne to w ogóle mam prawo korzystać z ANOVY, a nie przypadkiem testu kruskala-wallisa????

Juz mi się wszystko pomieszało
 
     
mathkit 
Major



Pomógł: 46 razy
Wiek: 34
Posty: 1301
Skąd: Katowice
Wysłany: 2007-09-12, 19:37   

Ale żeś dociekliwa, ale to dobrze :mrgreen:

Jeżeli mamy jednakową liczebność prób, sprawa rzeczywiście jest prostsza. Fachowo nazywa się to zrównoważonym (ortogonalnym) układem eksperymentalnym (balanced design). Jeżeli układ nie jest zrównoważnony wówczas analizy rzeczywiście stają się trudniejsze, dlatego zaleca się aby tak planować eksperyment, aby otrzymać układy ortogonalne.

Za Arhensem (1970) - w jednoczynnikowej analizie arkusz wyników układu niezrównoważonego pokrywa się z wynikami analizy wariancji o tej samej liczebności prób.

Kluczową rolę odgrywają jednak tutaj założenia o normalności i jednorodności, dlatego tak Cię o nie męczę...
W przypadku zrównoważonego układu, test F jest odporny na "średniej" wielkości odchylenia od jednorodności i normalności. W przypadku niezrównoważonym mamy poważniejsze kłopoty, gdy któreś założenie nie jest spełnione.

Oczywiście zawsze możesz stosować nieparametryczny odpowiednik, czyli Kruskala-Wallisa.
 
 
     
VIP 
Szeregowy


Posty: 10
Skąd: Warszawa
Wysłany: 2008-02-04, 23:30   ANOVA przy nierównej liczebności grup

Witam.
Czy poprawne jest wykonanie jednoczynnikowej analizy wariancji dla porównania 6 grup, z krórych grupa podstawowa liczy 153 osoby, a pozostałe 5 po trzydzieści kilka?
 
     
cogito 
Podporucznik



Pomógł: 30 razy
Posty: 310
Skąd: Wrocław
Wysłany: 2008-02-05, 17:51   

Cytat:
Witam.
Czy poprawne jest wykonanie jednoczynnikowej analizy wariancji dla porównania 6 grup, z krórych grupa podstawowa liczy 153 osoby, a pozostałe 5 po trzydzieści kilka?



nie ma przeszkod, pod warunkiem ze wariancje sa homogenne (rowne)
_________________
pozdrawiam
Przemek
www.biecek.pl
 
     
VIP 
Szeregowy


Posty: 10
Skąd: Warszawa
Wysłany: 2008-02-06, 19:30   

Dzięki
 
     
zibelda
[Usunięty]

Wysłany: 2008-03-03, 23:18   Statystyka parametryczna vs nieparametryczna

Głowię się często jak to jest: kiedy stosować statystyki parametryczne a kiedy nieparametryczne. Niby są założenia co do rozkładu, ale czytam często że jesli n>100 to nie mają znaczenia rozbieżności. Mam pytanie co to znaczy niewielkie i co gdy np. n=80? :oops: :oops:
 
     
cogito 
Podporucznik



Pomógł: 30 razy
Posty: 310
Skąd: Wrocław
Wysłany: 2008-03-04, 09:35   

Jezeli nie wiesz kiedy ktore stosowac to stosuj nieparametryczne
efektywosc wielu metod nieparametrzcznych to 0.955 (np. KW) wiec traci sie najczęściej niewiele
_________________
pozdrawiam
Przemek
www.biecek.pl
 
     
zibelda
[Usunięty]

Wysłany: 2008-03-04, 10:47   Nle chyba nie wszystkie!

Chyba lepiej jednak wykonać test ANOVA (F) niż Friedmana. Choć zapewne masz rację, że jeśli mam wątpliwości...

1. Ale np. co jeśli nie mam jasności w jakiej skali jest zmienna.

2. Czy jeśli Friedman to statystyka rang, to czy mam tę zmienną przed obliczeniem porangować, czy też program statystyczny robi to za mnie? :oops:
 
     
cogito 
Podporucznik



Pomógł: 30 razy
Posty: 310
Skąd: Wrocław
Wysłany: 2008-03-04, 21:56   

ANOVA jest (ciut) lepsza jeżeli kontrolujesz zalozenia,

Jeżeli w analizach trafi Ci sie duza wartosc odstająca, albo założenia co do rozkladu nie sa spelnione (rozklad ciezkoogonowy, mieszanina, silnie skosny itp) to wyniki ANOVA sa (najczesciej) malo uzyteczne

Jezeli chodzi o pytanie 2, to zależy od oczywiście od programu,
dobre (a z pewnością R) rangi wyznacza same

Osobiscie preferuje podejscie polegajace na wykonaniu testu parametrycznego i nieparametrycznego, jezeli wyniki sie roznia to trzeba dociec dlaczego,
w koncu celem jest zrozumienie co sie dzieje w danych a nie wykonanie testu
_________________
pozdrawiam
Przemek
www.biecek.pl
 
     
zibelda
[Usunięty]

Wysłany: 2008-03-06, 17:46   

"Ponadto zmienna zależna powinna podlegać rozkładowi normalnemu w obrębie grup. "

Mam próbę i chcę przebadać ją ze względu na pewną cechę - 5 wartości, a zatem mam pięć grup, które nie są równo liczne. Odnosząc się do tego co napisałeś, zbadałam rozkład w obrębie grup i jak na moje oko (histogramy) nie jest to rozkład normalny. Może są jakieś testy, które badają rozkład w obrębie grup, tak jak K-S z oprawką Lilieforsa?
 
     
Wyświetl posty z ostatnich:   
Odpowiedz do tematu
Nie możesz pisać nowych tematów
Nie możesz odpowiadać w tematach
Nie możesz zmieniać swoich postów
Nie możesz usuwać swoich postów
Nie możesz głosować w ankietach
Nie możesz załączać plików na tym forum
Możesz ściągać załączniki na tym forum
Dodaj temat do Ulubionych zakładek(IE)
Wersja do druku

Skocz do:  

Podobne Tematy
Temat Autor Forum Odpowiedzi Ostatni post
Brak nowych postów Przyklejony: Post hoc do Anova Friedmana
ailiem Testowanie hipotez statystycznych 17 2014-03-07, 07:28
Peniakoff
Brak nowych postów Przyklejony: Test post hoc Tukey'a ANOVA
klemensss Testowanie hipotez statystycznych 36 2016-10-13, 16:15
wwwmetodologpl
Brak nowych postów ANOVA/ testy sferyczności/ test ANOVA Friedmana
rokub95 Testowanie hipotez statystycznych 0 2016-04-13, 11:30
rokub95
Brak nowych postów ANOVA
hadian Testowanie hipotez statystycznych 0 2015-01-20, 14:41
hadian
Brak nowych postów [R] 3 czynnikowa ANOVA !!!
potrzebna pomoc !!!
rafal.p Data Mining, Metody klasyfikacji 1 2011-10-05, 21:22
jabol

Ideą przyświecającą istnieniu forum statystycznego jest stworzenie możliwości wymiany informacji, poglądów i doświadczeń osób związanych ze statystyką, mierzenie się z różnego rodzaju problemami statystycznymi i aktuarialnymi. Poruszane problemy: Statystyka w badaniach sondażowych rynku, metody reprezentacyjne, Teoria i rachunek prawdopodobieństwa, statystyka opisowa, teoria estymacji, testowanie hipotez statystycznych, ekonometria, prognozowanie, metody data mining.
Copyright (C) 2006-2015 Statystycy.pl
Powered by phpBB modified by Przemo © 2003 phpBB Group
Strona wygenerowana w 0,11 sekundy. Zapytań do SQL: 27