Statystyka, prognozowanie, ekonometria, data mining Strona Główna
Reklama pqstat.pl
Statystyka, prognozowanie, ekonometria, data mining
Forum miłośników statystyki - Portal Statystyczny

FAQFAQ  SzukajSzukaj  UżytkownicyUżytkownicy  GrupyGrupy  StatystykiStatystyki
RejestracjaRejestracja  ZalogujZaloguj  Chat   Regulamin  Kadra forum
PORTAL STATYSTYCZNY
 Ogłoszenie 
FORUM STATYSTYCZNE MA JUŻ 10 LAT

Znasz statystykę lub ekonometrię, metody prognozowania, data mining i chcesz pomóc w rozwoju forum statystycznego ?
Pisz na: administrator(małpa)statystycy.pl

Rozpoczął swoją działalność portal statystyczny - masz pomysł na jego rozwój ?

Drogi forumowiczu! Zanim napiszesz posta zapoznaj się z regulaminem forum i przedstaw się
The International Year of Statistics (Statistics2013) Free statistics help forum. Discuss statistical research, statistical consulting Smarter Poland Portal statystyczny

Poprzedni temat «» Następny temat

Tagi tematu: analiza wariancji, anova

ANOVA
Autor Wiadomość
laik 
Szeregowy
laik


Posty: 3
Skąd: Poznań
  Wysłany: 2008-08-09, 15:51   ANOVA czy Test Kruskala-Wallisa

Witam. Jestem totalnym wręcz laikiem, który musi zrobić analizę doświadczenia. No i tu juz same problemy. Po krótce opisze doświadczenie:

Rzepak - badanie skuteczności różnych środków ochrony roślin, stosowanych w różnych dawkach i terminach przeciwko jednej chorobie. Mam więc 10 takich wariantów. różne warianty były testowane na tej samej odmianie, która była uprawiana wg tych samych norm. Jedynym czynnikiem różnicującym były tylko te zabiegi ochronne.
Z każdego pola - wariantu pobierałem próbę 300 roślin i oceniałem czy jest choroba czy nie.
Moje dane mają więc postać kodu, gdzie 0 oznacza, że roślina była zdrowa, a 1 że chora. Policzyłem oczywiście podstawowe wskaźniki, jak chocby % roślin chorych.

Teraz mi każą sprawdzic statystycznie, czy różnice w ilości roślin chorych pomiędzy poszczególnymi wariantami są istotne czy nie (na poziomie istotności 0,05). Jakim testem powinienem sprawdzic czy są różnice pomiędzy tymi 10 wariantami? Wydaje mi się, że standardowa ANOVA odpada, ponieważ zmienna zależna nie jest cechą ilościową tylko jakościową, więc nie można mówić o rozkładzie normalnym. Dlatego myślę o teście Kruskala-Wallisa, który podobno jest odpowiednikiem ANOVY jednoczynnikowej w statystyce nieparametrycznej. Czy uważacie, że zastosowanie tego testu będzie prawidłowe? a może w ogóle powinienem to zrobić jakoś inaczej, albo w ogóle nie powinienem się za to brać?

Please, HELP!
_________________
Czy to w ogole mozna zrozumiec?
 
     
Google

Wysłany:    Reklama google.

 
 
cogito 
Podporucznik



Pomógł: 30 razy
Posty: 310
Skąd: Wrocław
Wysłany: 2008-08-13, 19:10   

moim zdaniem powinienes poczytac o regresji logistycznej
_________________
pozdrawiam
Przemek
www.biecek.pl
 
     
laik 
Szeregowy
laik


Posty: 3
Skąd: Poznań
Wysłany: 2008-08-25, 12:33   

regresja logistyczna..........................

no ok, zaraz patrze co to jest :mrgreen:

[ Dodano: 2008-09-03, 17:41 ]
no i po ptakach. myslałem że sobie siądę i wszystko policzę, a tu mi oczy wyszły na wierzch :shock:

no więc w "statistice" chcę zrobic tą regresje logistyczna, ale muszę wybrać z listy metodę estymacji. I tutaj wielki znak zapytania. oczywiście nie mam pojecia o co w tym chodzi. próbowałem o tym poczytać, ale po przeczytaniu pierwszych 10 zdań stwierdziłem, że i tak nic z tego nie pojmę :) Więc pomóżcie, którą z dostepnych metod mam wybrać i dlaczego:
- quasi-Newtona
- sympleksu
- sympleksu i quasi Newtona
- Hookey'a-Jeevesa
- Hookey'a-Jeevesa i quasi-Newtona
- Rosenbrocka
- Rosenbrocka i quasi-Newtona

no i co ja mam zrobić?
_________________
Czy to w ogole mozna zrozumiec?
 
     
biometricus 
Szeregowy


Posty: 17
Skąd: Warszawa
Wysłany: 2008-09-14, 21:08   

Ogólnie rzecz biorąc, masz do czynienia z uogólnionymi modelami liniowymi (GLM), których regresja logistyczna jest jednym z elementów. Skoro piszesz, że jesteś laikiem, rozumiem, że Twoim zadaniem jest interpretacja konkretnego doświadczenia. Regresja logistyczna czy ogólnie GLM nie są wcale bardzo proste w interpretacji. Możesz najpierw spróbować klasyki, która była stosowana zanim GLM weszło do użycia, a mianowicie zastosowanie transformacji Blissa (w przeciwieństwie do samej transformacji, która jest niezwykle popularna, nazwa jest mało znana i właściwie nie wiem, skąd pochodząca), a mianowicie arc sin (sqrt(X)), czyli arcus sinus z pierwiastka X. X jest tu procentem roślin zdrowych (czy chorych, to zależy od Ciebie). Jest to standardowa transformacja normalizująca takie dane. Jako że dalej przeprowadzasz analizę wariancji, nie powinieneś mieć problemu z interpretacją danych i - co może być równie ważne - z przekonaniem tych, którym masz swoje analizy przedstawić.

Ale, ale... Z Twojego opisu nie wynika zbyt wiele odnośnie układu doświadczalnego. Jak rozumiem, nie jest Twoim celem badanie wpływu dwóch czynników, jakie masz (dawka i termin), tylko ich kombinacji (czyli wariant). OK, możesz i tak analizować. Ale dalej jest nieco gorzej. Z Twojego opisu wynika, że dany wariant badany był na jednym polu, z którego pobierałeś próbę 300 roślin. Jeżeli rzeczywiście tak było, to przykro mi, ale mogę doradzić tylko jedno: ... smutne, ale powtórzenie doświadczenia. Ktoś powie: "Bracie, przecież to 300 powtórzeń!" Nieprawda. To nie są powtórzenia, tylko tzw. pseudo-powtórzenia (ang. pseudo-replication). W tego typu badaniach powtórzeniem powinno być pole, a nie roślina - chyba że warianty rozlosowano by pomiędzy rośliny (mało możliwe, zwłaszcza że mało sensowne z merytorycznego punktu widzenia). Dlatego nieważne jaką metodę zastosujesz, nie będziesz porównywał wariantów (co jest Twoim celem), tylko pola (których porównanie jest równie interesujące jak zeszłoroczny śnieg). Przykro mi to mówić, ale jest to częsty błąd doświadczalny, na tym etapie doświadczenia nie do naprawienia w inny sposób, jak powtórzenie doświadczenia.

Mam nadzieję, że moje wywody były choć trochę jasne. Z chęcią odpowiem na ewentualne dalsze pytania.

Pozdrawiam
Biometricus 8-)
 
     
laik 
Szeregowy
laik


Posty: 3
Skąd: Poznań
Wysłany: 2008-09-14, 22:39   jaki test nieparametryczny?

witam,

mam pytanie. oceniam intensywność objawów choroby w zależności od stosowanych pestycydów. objawy oceniam wg skali 0-9, czyli jest to cecha jakościowa. teraz chciałbym sprawdzić, czy różnice w skuteczności poszczególnych pestycydów są istotne. aha, we wszystkich przypadkach rozkład zmienej jest lewostronnie asymetryczny - generalnie co najmniej 70% rożlin jest zdrowa, czyli ma wartość zmiennej 0.

wiem tyle, że muszę to ugryźć testami nieparametrycznymi. teraz zastanawiam się którymi - z tego co wiem test U Manna-Witneya, test serii Walda i Wolfowitza i test Kołmogorowa Smirnoffa wymagają zmiennej ilościowej. do tej pory stosowałem regresje logistyczną (po przeróbce danych na tylko 2 kategorie - roślina zdrowa lub nie). zastanawiam się jednak, czy jest jakiś prostszy test, którym mógłbym porównać ze sobą różne preparaty.

i ostatnia sprawa. czy istnieje jakis test, w którym mnógłbym porównać ze soba na raz kilka pestycydów, a potem przeprowadzić dodatkowy test, który pokazywałby które z pestycydów posiadają istotnie różną skuteczność, a które nie? Czyli cos analogicznego do post-hoc w ANOVIE, tylko dla nieparametrycznych?
_________________
Czy to w ogole mozna zrozumiec?
 
     
biometricus 
Szeregowy


Posty: 17
Skąd: Warszawa
Wysłany: 2008-09-15, 05:10   Re: jaki test nieparametryczny?

Witam,

Przy zmiennej w skali 0-9 można próbować standardową analizę wariancji - jest wystarczająco dużo wartości - jeżeli tylko spełnione są założenia. Nie precyzujesz, czy masz dwie grupy czy więcej, czy chodzi Ci o dawkę pestycydu [zmienna ilościowa], czy o rodzaj [zmienna jakościowa]; założę więc, że jest więcej grup i że chodzi o zmienną jakościową, wtedy bowiem rzeczywiście można stosować analizę wariancji.; ze zmienną ilościową możesz pokusić się o analizę regresji.

Skoro już wiesz, że zmienna mało rozkład prawostronnie skośny, możesz pokusić się o zastosowanie transformacji. Najefektowniejsza jest transformacja Boxa-Coxa, ponieważ jest to właściwie duża rodzina transformacji, zawierająca wszystkie podstawowe (łącznie z potęgową, pierwiastkową czy logarytmiczną). Jednak należy pamiętać, że interpretowalność jest największa wtedy, kiedy wybierasz transformację interpretowalną - czyli właśnie choćby logarytmiczną. Spróbuj, a może się uda.

Metody (tzw.) nieparametryczne, o których wspomniałeś, również mają swoje założenia. Pamiętaj, że największym problemem w analizie wariancji jest nie spełnienie założenia normalności rozkładu zmiennej w grupach, ale to o równości wariancji. Jeżeli ono jest spełnione, to spokojnie możesz jechać z anovą - ale to trzeba sprawdzić, ponieważ niepokojący jest skośny rozkład; jednak trzeba przeanalizować tę skośność w grupach, a nie dla danych połączonych.

Test F jest odporny na brak normalności rozkładu pod warunkiem, że pozostałe warunki są spełnione (równość wariancji i niezależność obserwacji). Więc się nie przejmuj skalą bonitacyjną. A jeżeli pewne założenia nieco nie są spełnione (gro przypadków w praktyce), należy o tym wspomnieć i traktować wnioski jako przybliżone - jest o bardziej prawidłowe niż stosowanie zmiennej logistycznej.

Na koniec warto dodać, że zmienna 0-9 może być analizowana przy pomocy uogólnionych modeli liniowych dla zmiennej o rozkładzie wielomianowym. Szczerze, jeżeli nie masz kilku miesięcy na to, żeby się w to porządnie wgryźć, polecam powyższe manewry, które wcale nie są nieprawidłowe czy odbiegające od standardu.

Biometricus 8-)
 
     
cogito 
Podporucznik



Pomógł: 30 razy
Posty: 310
Skąd: Wrocław
Wysłany: 2008-09-16, 01:21   

biomet:
Cytat:

Przy zmiennej w skali 0-9 można próbować standardową analizę wariancji - jest wystarczająco dużo wartości - jeżeli tylko spełnione są założenia.


Dla zmiennej przyjmującej 10 wartości zalozenia ANOVA jak i testu F sa z definicji nie spelnione.
Dla malych prob, gdyby nic wiecej nie wiedziec mozna by ta ANOVA przechnac na sile, ale ....
jezeli w 0 jest atom, a tam 70% obserwacji to zadna transformacja nie pomoze i ANOVA NIE JEST dobrym rozważaniem

laik:
Cytat:

po przeróbce danych na tylko 2 kategorie - roślina zdrowa lub nie


To zawsze redukcja danych, ale mozna ja jeszcze zaakceptowac
Przy takim podziale mozesz wykorzystac test na wskaznik struktury (prawdopodobienstwo sukcesu). W R jest taki test w funkcji prop.test()
Test zweryfikuje, czy prawdopodobienstwo zachorowania jest takie samo dla kazdego preparatu a nastepnie w parach mozesz sprawdzic gdzie sa roznice

Bardziej profesjonalnie rozwiazanie (choc wymaga to wiecej potu) to odpowiednio zamodelowac ceche 'objawy choroby' (moze rozklad Bern. moze Poissona, trzeba sprawdzic) a nastepnie uzyc uogolnionych modeli liniowych lub ich prostszego odpowiednika (zalezy jaki rozklad sie dopasuje do cechy 'objawy choroby')
 
     
nofast 
Szeregowy


Posty: 1
Skąd: Katowice
Wysłany: 2008-10-15, 17:38   Kruskal-Waalis w Statistica 7.0

Witam, bardzo proszę o pomoc.
Musze przeprowadzić test istotności statystycznej żeby potwierdzić, ze posiadane dane pochodzą z różnych grup.
Do tego celu mam użyć testu K-W lub ANOVA.
Dane składają sie z 2 kolumn tzn. analizuje wartosci stezenia substancji A w tkance X i Y. Moim celem jest odpowiedz na pytanie czy istnieją statystycznie istotne roznice stezenia A między tkanką X i tkanką Y. Ilosc wynikow w Y jest inna niż w X. Wynikow Y jest 20, wynikow X jest 50.

Posiadane wynik wklejam do programu Statistica i wybieram w Menu Statistic Nonparametrics i dalej Comparing multiple indep. samples (groups) i tu pojawia sie problem gdy natrafiam na okno wyboru zmiennych zaleznych i niezaleznych. Nie wiem co dalej zrobic. Zaznaczajac jedne jako zalezne a drugie niezalezne p wychodzi mi 1 ;), jak nie zaznacze w jednym oknie nic program to monituje.

HELP ME!!!
 
     
Lady Tilly 
Chorąży


Pomogła: 9 razy
Wiek: 37
Posty: 129
Skąd: Poznań
Wysłany: 2008-10-27, 10:08   

Tutaj - klik znajdziesz proceurę. Nie będę teraz dokładnie opisywać co po kolei - mam nadzieję, że to pomoże.
 
 
     
cogito 
Podporucznik



Pomógł: 30 razy
Posty: 310
Skąd: Wrocław
Wysłany: 2008-10-27, 22:50   

Cytat:
Musze przeprowadzic test istotnosci statystycznej zeby potwierdzic, ze posiadane dane pochodza z roznych grup.


Raczej chcesz sprawdzic czy jakas zmienna rozni sie istotnie pomiedzy grupami obserwacji.
Różne grupy są różne eeeee..... z definicji.

BPNNSP ;-)
_________________
pozdrawiam
Przemek
www.biecek.pl
 
     
darek12345 
Starszy Szeregowy
darek12345


Wiek: 37
Posty: 26
Skąd: Warszawa
Wysłany: 2008-12-01, 15:22   Re: ANOVA czy Test Kruskala-Wallisa

laik napisał/a:
Dlatego myslę o tescie Kruskala-Wallisa, który podobno jest odpowiednikiem ANOVY jednoczynnikowej w statystyce nieparametrycznej. Czy uważacie, że zastosowanie tego testu będzie prawidłowe? a może w ogóle powinienem to zrobić jakoś inaczej, albo w ogóle nie powinienem się za to brać?

Please, HELP!


Oczywiście mozesz zastosowac test Kruskalla-Wallisa jeśli dla każdego wariantu masz dwa powtórzenia, czyli w Twoim przypadku 2 poletka.

Jesli natomiast nie masz powtórzeń (czyli co najmniej dwóch poletek) dla każdego wariantu ochrony to pozostaje jeszcze porównanie frakcji (parametrów p dla rozkładu dwumianowego). W Twoim przypadku jako frakcję mozna uznać % udział roslin porazonych. Testów do porównania frakcji (czyli własciwie tablic 2 x 2) jest wiele. W zalezności jakim oprogramowaniem dysponujesz to rózne sa do dyspozycji, np. bardzo czesto wykorzystywany test Chi-kwadrat.
Wtedy jednak musisz porównywac pary wariantów miedzy sobą. Jesli masz 10 róznych wariantów, to wszystkich par porównań będzie 45.
 
     
kamabea 
Szeregowy


Posty: 1
Skąd: Białystok
Wysłany: 2009-01-09, 21:05   

Mam pytanie, a raczej problem...natury medycznej...

Muszę porównać testem ANOVA wartości średniej objętości płytek krwi (dwa pomiary) w badanej przeze mnie populacji. Korzystam z programu statistica, ale nie moge się połapać, o co chodzi w zaznaczniu tych wartości.
Policzyłam to testem t-studenta i wyszła mi wartość istotna statystycznie, p=0,002 (p<0,05) i teraz mam sprawdzić czy ta wartość ma jakieś znaczenie w analizie ANOVA.
Moje wątpliwości...
-jaki test wybrać? wydawało mi się, że 1-way ANOVA, bo on uwzględnia zmienność różnych wartości jednej cechy w obrębie tej samej grupy. MAm rację???
Nie wiem tylko, jak to policzyć w programie...Używałam wcześniej zakładki Excela-Analyse-it, było to o wiele prostsze...
Nie znam nikogo, kto po przejrzeniu tych danych mógłby pomóc mi to policzyć. Sprawa dość pilna, bo do niedzieli muszę wysłać streszczenie pracy.

Pozdrawiam i dziękuję za podpowiedzi :-)
 
     
roz88 
Szeregowy


Posty: 2
Skąd: Wrocław
  Wysłany: 2009-02-14, 17:06   Zadanie (prosze o pomoc )

Ocenić siłę zależności (nieliniowej) między miejscem zamieszkania a
wysokością miesięcznego kieszonkowe w grupie 40 nastolatków, dla
których średnie kieszonkowe (dla całej grupy) wynosi 50 zł , a
odchylenie standardowe 40 zł. Wiadomo że wśród 10 osób mieszkających
na wsi średnia wynosiła 30 zł, odchylenie standardowe 8 zł, a w grupie
10 osób małych miast kieszonkowe miało przeciętnie wysokość 50 zł z
odchyleniem standardowym 20 zł a w grupie pozostałych mieszkających w
dużych miastach średnie kieszonkowe wynosiło 60 zł

Jakim sposobem to trzeba rozwiazac? Trzeba robić tablice korelacji ? o co chodzi zą zależnością nieliniową ?? Czy zadanie liczymy współczynnikiem korelacji rang Spearmana? Bardzo porsze o pomoc. :cry:
 
     
Lady Tilly 
Chorąży


Pomogła: 9 razy
Wiek: 37
Posty: 129
Skąd: Poznań
Wysłany: 2009-02-15, 01:06   

Skorzystaj tutaj oło tutaj
_________________
Co to jest statystyka?
- Jeśli trzymasz głowę w lodzie a nogi w ogniu to średnio biorąc jest ci dobrze.
 
 
     
mathkit 
Major



Pomógł: 46 razy
Wiek: 33
Posty: 1301
Skąd: Katowice
Wysłany: 2009-02-15, 10:12   

Tak jak pisze Lady Tilly, musisz zastosowować test dla wielu średnich. Skorzystaj ze statystyki F. Pobawić się tylko musisz ze zmiennością wewnątrz populacyjną i wyliczyć jakie jest zmienność wysokości kieszonkowego w grupie nastolatków dużych miast.
 
 
     
Wyświetl posty z ostatnich:   
Odpowiedz do tematu
Nie możesz pisać nowych tematów
Nie możesz odpowiadać w tematach
Nie możesz zmieniać swoich postów
Nie możesz usuwać swoich postów
Nie możesz głosować w ankietach
Nie możesz załączać plików na tym forum
Możesz ściągać załączniki na tym forum
Dodaj temat do Ulubionych zakładek(IE)
Wersja do druku

Skocz do:  

Podobne Tematy
Temat Autor Forum Odpowiedzi Ostatni post
Brak nowych postów Przyklejony: Post hoc do Anova Friedmana
ailiem Testowanie hipotez statystycznych 17 2014-03-07, 07:28
Peniakoff
Brak nowych postów Przyklejony: Test post hoc Tukey'a ANOVA
klemensss Testowanie hipotez statystycznych 36 2016-10-13, 17:15
wwwmetodologpl
Brak nowych postów ANOVA/ testy sferyczności/ test ANOVA Friedmana
rokub95 Testowanie hipotez statystycznych 0 2016-04-13, 12:30
rokub95
Brak nowych postów ANOVA
hadian Testowanie hipotez statystycznych 0 2015-01-20, 14:41
hadian
Brak nowych postów Prośba o pomoc. ANOVA
Gracia Statystyka opisowa 4 2017-05-24, 13:49
Gracia

Ideą przyświecającą istnieniu forum statystycznego jest stworzenie możliwości wymiany informacji, poglądów i doświadczeń osób związanych ze statystyką, mierzenie się z różnego rodzaju problemami statystycznymi i aktuarialnymi. Poruszane problemy: Statystyka w badaniach sondażowych rynku, metody reprezentacyjne, Teoria i rachunek prawdopodobieństwa, statystyka opisowa, teoria estymacji, testowanie hipotez statystycznych, ekonometria, prognozowanie, metody data mining.
Copyright (C) 2006-2015 Statystycy.pl
Powered by phpBB modified by Przemo © 2003 phpBB Group
Strona wygenerowana w 0,14 sekundy. Zapytań do SQL: 26