Statystyka, prognozowanie, ekonometria, data mining Strona Główna
Reklama pqstat.pl
Statystyka, prognozowanie, ekonometria, data mining
Forum miłośników statystyki - Portal Statystyczny

FAQFAQ  SzukajSzukaj  UżytkownicyUżytkownicy  GrupyGrupy  StatystykiStatystyki
RejestracjaRejestracja  ZalogujZaloguj  Chat   Regulamin  Kadra forum
PORTAL STATYSTYCZNY
 Ogłoszenie 
FORUM STATYSTYCZNE MA JUŻ 10 LAT

Znasz statystykę lub ekonometrię, metody prognozowania, data mining i chcesz pomóc w rozwoju forum statystycznego ?
Pisz na: administrator(małpa)statystycy.pl

Rozpoczął swoją działalność portal statystyczny - masz pomysł na jego rozwój ?

Drogi forumowiczu! Zanim napiszesz posta zapoznaj się z regulaminem forum i przedstaw się
The International Year of Statistics (Statistics2013) Smarter Poland Portal statystyczny

Poprzedni temat «» Następny temat

Tagi tematu: Brak tagów.

Założenie o normalności rozkładu zmiennej Y|X
Autor Wiadomość
sylwia 
Szeregowy
sylwia


Posty: 1
Skąd: Łódź
Wysłany: 2008-06-22, 11:56   Założenie o normalności rozkładu zmiennej Y|X

mam drobne pytanko, czy w regresji wielokrotnej krokowej wszystkie zmienne muszą mieć rozkład normalny?
Ostatnio zmieniony przez mathkit 2008-09-29, 09:55, w całości zmieniany 1 raz  
 
     
Google

Wysłany:    Reklama google.

 
 
cogito 
Podporucznik



Pomógł: 30 razy
Posty: 310
Skąd: Wrocław
Wysłany: 2008-06-22, 12:42   

w modelu regresji zaklada sie rozkald dla zmiennej objasnianej Y
to Y powinien miec rozklad normalny (pod warunkiem X)

w praktyce, odstajace obserwacje w zmiennych X moga wplywac na jakosc estymacji wspolczynnikow modelu regresji
_________________
pozdrawiam
Przemek
www.biecek.pl
 
     
biometricus 
Szeregowy


Posty: 17
Skąd: Warszawa
Wysłany: 2008-09-14, 20:35   

cogito napisał/a:
w praktyce, odstajace obserwacje w zmiennych X moga wplywac na jakosc estymacji wspolczynnikow modelu regresji


Przemek, wchodzisz w tematy, o których należałoby napisać dużo więcej (przynajmniej jeden rozdział). Wystarczy powiedzieć, że zmiennej X powinny być deterministyczne i niezależne, więc bynajmniej rozkładu normalnego mieć nie muszą (nie mogą, jako że nie są losowe). Jeżeli zaś są losowe, no to cóż... trzeba by napisać ten rozdział... Estymacja, a przede wszystkim jej jakość (precyzja), model II regresji i te sprawy, nie takie to łatwe. Obserwacje odstające rzeczywiście mogą dać do wiwatu, nie powiem, ale są na to sposoby - choćby regresja ważona. Ale nie zaczynajmy tego rozdziału...

Biometricus 8-)
 
     
Pearson 
Podporucznik
Pearson



Pomógł: 12 razy
Posty: 199
Skąd: Wrocław
Wysłany: 2008-09-15, 12:23   

A ja powiem, że nie muszą mieć.
 
     
biometricus 
Szeregowy


Posty: 17
Skąd: Warszawa
Wysłany: 2008-09-15, 19:13   

Pearson napisał/a:
A ja powiem, że nie muszą mieć.


Takie proste to też nie jest, bo co w przypadku, gdy zmienne przyczynowe są losowe? Czy mogą mieć dowolny rozkład, czy może wielowymiarowy rozkład normalny?
 
     
Pearson 
Podporucznik
Pearson



Pomógł: 12 razy
Posty: 199
Skąd: Wrocław
Wysłany: 2008-09-15, 22:18   

biometricus napisał/a:
Takie proste to też nie jest, bo co w przypadku, gdy zmienne przyczynowe są losowe? Czy mogą mieć dowolny rozkład, czy może wielowymiarowy rozkład normalny?


Chodzi o f(y|x). Uważam, że normalności nie jest konieczna.
 
     
cogito 
Podporucznik



Pomógł: 30 razy
Posty: 310
Skąd: Wrocław
Wysłany: 2008-09-15, 23:34   

biomet:
Cytat:

Wystarczy powiedzieć, że zmiennej X powinny być deterministyczne i niezależne,


Niezaleznosc standardowo definiuje sie dla zmiennych losowych,

pearson:
Cytat:

Chodzi o f(y|x). Uważam, że normalności nie jest konieczna


zgadzam sie w zupelnosci,
jest wiele modeli regresji w ktorych zaklada sie inny rozklad na f(y|x)

w standardowej regresji liniowej zaklada sie normalnosc f(y|x) i przy tym zalozeniu konstruuje sie testy, przedzialy ufnosci itp
 
     
biometricus 
Szeregowy


Posty: 17
Skąd: Warszawa
Wysłany: 2008-09-16, 02:53   

cogito:

Cytat:
Niezaleznosc standardowo definiuje sie dla zmiennych losowych,

Źle się wyraziłem. Zmienne te powinny być ortogonalne. To klasyczne założenie regresji.
 
     
Pearson 
Podporucznik
Pearson



Pomógł: 12 razy
Posty: 199
Skąd: Wrocław
Wysłany: 2008-09-17, 08:38   

cogitoII napisał/a:
jest wiele modeli regresji w ktorych zaklada sie inny rozklad na f(y|x)

Nie o to mi chodziło, choć to prawda. Ale o to:
Cytat:
w standardowej regresji liniowej zaklada sie normalnosc f(y|x)

Zakłada się, ale nie jest ona konieczna. Czego nie możesz zrobić, jeśli zapomnisz o tym założeniu?

I jeszcze jedno:
biometricus napisał/a:
Zmienne te powinny być ortogonalne

Jeśli trzymałbyś się tego założenia, to nigdy byś regresji nie zbudował. Potrzeba, aby zm. były słabo skorelowane między sobą.
 
     
cogito 
Podporucznik



Pomógł: 30 razy
Posty: 310
Skąd: Wrocław
Wysłany: 2008-09-17, 10:27   

Cytat:

Zakłada się, ale nie jest ona konieczna. Czego nie możesz zrobić, jeśli zapomnisz o tym założeniu?


Jezeli nie znasz rozkladu y|x a zalozysz ze jest normlany (czyli stosujesz zwykla regresje)
to np.:
- rozklad wspolczynnikow beta sie zmieni
- nie wyznaczysz poprawnie przedzialow ufnosci dla wspolczynnikow beta
- nie kontrolujesz bledu pierwszego rodzaju testujac istotnosci wspolczynnikow beta
- nie wyznaczysz poprawnie przedzialow ufnosci dla predykcji.
- nie powinienes wykorzystywac wsp R2

Cytat:

Potrzeba, aby zm. były słabo skorelowane między sobą.


Korelacja to wspolczynnik, ktory wyznacza sie dla zmiennych losowych.

biomet może pozwolić sobie na ortogonalnosc, bo w biometrii czesto ma sie do czynienia z ukladami doswiadczalnymi i tam X'y sa takie jak chcemy

Slaba strona stwierdzenia ,,słabo skorelowane'' jest fakt ze nie wiadomo gdzie jest ta granica i jedyne co pozostaje to przymkniecie oka na potencjalne konsekwencje.
;-)
_________________
pozdrawiam
Przemek
www.biecek.pl
 
     
Pearson 
Podporucznik
Pearson



Pomógł: 12 razy
Posty: 199
Skąd: Wrocław
Wysłany: 2008-09-17, 21:54   

cogitoII napisał/a:
Jezeli nie znasz rozkladu y|x a zalozysz ze jest normlany (czyli stosujesz zwykla regresje)
to np.:
- rozklad wspolczynnikow beta sie zmieni
- nie wyznaczysz poprawnie przedzialow ufnosci dla wspolczynnikow beta
- nie kontrolujesz bledu pierwszego rodzaju testujac istotnosci wspolczynnikow beta
- nie wyznaczysz poprawnie przedzialow ufnosci dla predykcji.
- nie powinienes wykorzystywac wsp R2

Chodzi o to, że ja nic nie zakładam. Przedziały, istotność współczynników mogę wyznaczyć korzystając z testów bootstrapowych.

cogitoII napisał/a:
biomet może pozwolić sobie na ortogonalnosc, bo w biometrii czesto ma sie do czynienia z ukladami doswiadczalnymi i tam X'y sa takie jak chcemy

Jasne, niektóre układy są z def. ortogonalne. Ale nie miałem takich na myśli.

cogitoII napisał/a:

Slaba strona stwierdzenia ,,słabo skorelowane'' jest fakt ze nie wiadomo gdzie jest ta granica i jedyne co pozostaje to przymkniecie oka na potencjalne konsekwencje.

To może inaczej. Zmienne są skorelowane ze sobą na poziomie r=0.3. Czy obie zmienne włączysz do modelu? Bo zgodnie z waszymi sugestiami, włączasz jedynie zmienne nieskorelowane, czyli r=0.
W praktyce badawczej nigdy (pomijam układy eksperymentalne) r nie jest =0.
Są odpowiednie podejścia pozwalające rozstrzygnąć, czy korelacja między zmiennymi może być niebezpieczna.
 
     
cogito 
Podporucznik



Pomógł: 30 razy
Posty: 310
Skąd: Wrocław
Wysłany: 2008-09-17, 23:20   

Cytat:

Chodzi o to, że ja nic nie zakładam. Przedziały, istotność współczynników mogę wyznaczyć korzystając z testów bootstrapowych.


Uzywanie testow bootstrapowych z pewnoscia pozwala na radzenie sobie z wieloma przypadkami, ale to nie jest juz zwyka regresja liniowa i standardowe metody

Poza tym dla wrednych rozkladow bootstrap tez nie pomoze a rozwiazanie w postaci kosmicznie szerokich przedzialow ufnosci czy bardzo konserwatywnego testu to zadne rozwiazanie.

Cytat:

Są odpowiednie podejścia pozwalające rozstrzygnąć, czy korelacja między zmiennymi może być niebezpieczna.


Jakie metody?
Chetnie bym o nich cos solidnego przeczytal, bede wiec zobowiazany za odnosniki do ciekawych pozycji.

Bazowanie na VIF traktuje raczej jako opium dla ludu.
_________________
pozdrawiam
Przemek
www.biecek.pl
 
     
Pearson 
Podporucznik
Pearson



Pomógł: 12 razy
Posty: 199
Skąd: Wrocław
Wysłany: 2008-09-19, 14:48   

cogitoII napisał/a:
Uzywanie testow bootstrapowych z pewnoscia pozwala na radzenie sobie z wieloma przypadkami, ale to nie jest juz zwyka regresja liniowa i standardowe metody

Poza tym dla wrednych rozkladow bootstrap tez nie pomoze a rozwiazanie w postaci kosmicznie szerokich przedzialow ufnosci czy bardzo konserwatywnego testu to zadne rozwiazanie.

Chodzi o to, że jeśli dostaniesz zadanie polegające na zbudowaniu regresji, to nie powiesz swojemu zleceniodawcy, że nic z tego, bo rozkład nie jest normalny. Radzisz sobie wykorzystując dostępne narzędzia - rozdzielanie na klasyczne i nieklasyczne (niestandardowe) podejścia nie jest dobre. Z może wyrzucisz model do kosza?
Swoimi odpowiedziami chcę zwrócić uwagę na fakt, że przy okazji regresji liniowej ową normalność traktuje się jak dogmat i odrzucenie hipotezy o normalności = wyrzucenie modelu do kosza.

cogitoII napisał/a:
Jakie metody?
Chetnie bym o nich cos solidnego przeczytal, bede wiec zobowiazany za odnosniki do ciekawych pozycji.
Bazowanie na VIF traktuje raczej jako opium dla ludu.

Jak w całej statystyce, nie ma rzeczy pewny i jednoznacznych. Tak też tutaj istnieją pewne podejścia ułatwiające podjęcie decyzji. Do nich zaliczam: condition index and condition number, multicollinearity index, variance decomposition proportions (oparty na analizie głownych składowych), VIF.
Nie przytoczę Ci teraz dokładnych źródeł, więc specjalnie podałem po angielsku. Jak będę miał chwilę, to poszukam w swoich zasobach.
 
     
Wyświetl posty z ostatnich:   
Odpowiedz do tematu
Nie możesz pisać nowych tematów
Nie możesz odpowiadać w tematach
Nie możesz zmieniać swoich postów
Nie możesz usuwać swoich postów
Nie możesz głosować w ankietach
Nie możesz załączać plików na tym forum
Możesz ściągać załączniki na tym forum
Dodaj temat do Ulubionych zakładek(IE)
Wersja do druku

Skocz do:  

Podobne Tematy
Temat Autor Forum Odpowiedzi Ostatni post
Brak nowych postów Przyklejony: Test t i założenie normalności rozkładu
min45 Testowanie hipotez statystycznych 15 2016-04-14, 05:42
jabol
Brak nowych postów Przyklejony: przybliżenie rozkładem Poissona a rozkładem normalnym
Tw. Poissona contra Tw. de Moivre'a - Laplace'a
troll1 Teoria i rachunek prawdopodobieństwa 5 2007-03-31, 10:36
duraCELL
Brak nowych postów Przyklejony: Testowanie normalności rozkładu
dree Testowanie hipotez statystycznych 1 2006-11-07, 20:03
mathkit
Brak nowych postów Przyklejony: Normalność rozkładu reszt w modelu ARMA
haver Modelowanie ekonometryczne 3 2009-05-24, 09:30
Pearson
Brak nowych postów Przyklejony: Standaryzacja zmiennej losowej o rozkładzie N(m,s)
kamila Teoria i rachunek prawdopodobieństwa 206 2012-11-05, 12:58
Shidley

Ideą przyświecającą istnieniu forum statystycznego jest stworzenie możliwości wymiany informacji, poglądów i doświadczeń osób związanych ze statystyką, mierzenie się z różnego rodzaju problemami statystycznymi i aktuarialnymi. Poruszane problemy: Statystyka w badaniach sondażowych rynku, metody reprezentacyjne, Teoria i rachunek prawdopodobieństwa, statystyka opisowa, teoria estymacji, testowanie hipotez statystycznych, ekonometria, prognozowanie, metody data mining.
Copyright (C) 2006-2015 Statystycy.pl
Powered by phpBB modified by Przemo © 2003 phpBB Group
Strona wygenerowana w 0,08 sekundy. Zapytań do SQL: 26