To jest tylko wersja do druku, aby zobaczyć pełną wersję tematu, kliknij TUTAJ
Statystyka, prognozowanie, ekonometria, data mining
Forum miłośników statystyki - Portal Statystyczny

Data Mining, Metody klasyfikacji - korelacje w dużych zbiorach danych

um85 - 2018-03-12, 20:45
Temat postu: korelacje w dużych zbiorach danych
Dzień dobry,

Proszę o informację jaką metodę proponują Państwo przy wyznaczeniu zależności pomiędzy zmiennymi Y i X1, X2, X3. Dane dotyczą 2 pacjentów (ale mierzone są w odstępach czasowych, więc dla każdego pacjenta jest ok 15 000 obserwacji). Chciałabym sprawdzić, czy występuje zależność pomiędzy pomiarami Y a pozostałymi zmiennymi X1, X2, X3.

Sprawdziłam zależność korelacji liniowej Pearsona i wychodzi rxy=0,2 - na wykresie rozrzutu widać, że nie jest to zależność liniowa i pomimo, że wynik jest istotny statystycznie wydaje mi się, że może istnieje korelacja krzywoliniowa - niestety nie wiem jak to wykazać. Wyznaczyłam w Statistice regresje liniową i jest R^2=0,07 wiec widać, że liniowy model jest źle dopasowany. Chciałabym się upewnić, czy wraz ze wzrostem Y rosną pozostałe wyniki X1, X2, X3 oraz czy wraz z tym jak maleje Y maleją pozostałe 3 zmienne - jakie metody mogłabym zastosować?

Z góry dziękuję za informacje, uwagi, sugestie i podpowiedzi :-)



Powered by phpBB modified by Przemo © 2003 phpBB Group