Statystyka, prognozowanie, ekonometria, data mining Strona Główna
Reklama pqstat.pl
Statystyka, prognozowanie, ekonometria, data mining
Forum miłośników statystyki - Portal Statystyczny

FAQFAQ  SzukajSzukaj  UżytkownicyUżytkownicy  GrupyGrupy  StatystykiStatystyki
RejestracjaRejestracja  ZalogujZaloguj  Chat   Regulamin  Kadra forum
PORTAL STATYSTYCZNY
 Ogłoszenie 
FORUM STATYSTYCZNE MA JUŻ 10 LAT

Znasz statystykę lub ekonometrię, metody prognozowania, data mining i chcesz pomóc w rozwoju forum statystycznego ?
Pisz na: administrator(małpa)statystycy.pl

Rozpoczął swoją działalność portal statystyczny - masz pomysł na jego rozwój ?

Drogi forumowiczu! Zanim napiszesz posta zapoznaj się z regulaminem forum i przedstaw się
The International Year of Statistics (Statistics2013) Smarter Poland Portal statystyczny

Poprzedni temat «» Następny temat

Tagi tematu: Brak tagów.

Analiza przeżycia
Autor Wiadomość
mathkit 
Major



Pomógł: 46 razy
Wiek: 34
Posty: 1301
Skąd: Katowice
Wysłany: 2008-06-12, 16:21   Analiza przeżycia

Ponieważ mamy kilku biostatystyków na forum, to liczę, że uzyskam odpowiedź na moje pytanie :mrgreen:

Okres badania : 3 lata
Wielkość próby: N= 10 000
Badam prawdopodobieństwo nie zrezygnowania z kursu (niektóre kursy trwają 12 , niektóre 24, 48 miesięcy)

Wyniki są takie:

Ilość miesięcy | Czy zrezygnował z kursu
11 | 1
20 | 0
3 | 1
.... | .....
8 | 0
Niestety nie mam informacji o tym, które obserwacje są obcięte.


Czy mogę stosować funkcję survfit() w celu estymacji krzywej przeżycia w R ?
 
 
     
Google

Wysłany:    Reklama google.

 
 
cogito 
Podporucznik



Pomógł: 30 razy
Posty: 310
Skąd: Wrocław
Wysłany: 2008-06-12, 18:05   

Co znaczy ze nie masz informacji ktore obserwacje sa odciete,
jezeli wiesz ktorzy uczestnicy zrezygnowali z kursu?

Obciete to informacje o tych osobnikach, ktore nie chcialy zrezygnowac z kursu w okreslonym okresie czasu (ale moze zrezygnowaly by pozniej).

Co do survfit to IMHO mozesz, ale z ostroznoscia ;-)
_________________
pozdrawiam
Przemek
www.biecek.pl
 
     
mathkit 
Major



Pomógł: 46 razy
Wiek: 34
Posty: 1301
Skąd: Katowice
Wysłany: 2008-06-12, 22:07   

Dzięki Cogito za odpowiedź, to ja jeszcze raz.
Postaram się to wytłumaczyć pytając. Nie wiem czy wyrażę się jasno.
Moje pytanie główne brzmi - czy przy analizie przeżycia nie jest potrzebna informacja czy i które to obserwacje są ucięte (albo czy taka informacja nie wspomaga informacji przy wyliczaniu prawdopodobieństw przeżycia).
Powiedzmy że mamy gościa, który zapisał się na kurs dwa lata temu (od chwili sporządzenia badania) i na chwilę obecną ma status 0 (nie zrezygnował z kursu). Ale nie wiem czy na przykład czas trwania jego kursu nie wynosi dokładnie 2 lat i nie ma możliwości zdefaultować (nie skończyć kursu), bo właśnie z chwilą badania zakończył kurs.
A może zapisał się na kurs czteroletni i jego obecna wartość miesięcy, które przeżył wynosi 24 ale ma możliwość zdefaultowania ( i wtedy jest to obserwacja ucięta).
I jeszcze jedno pytanie, jak się wylicza czas przeżycia - powiedzmy że gość się zapisał na kurs roczny dwa lata temu od chwili sporządzenia badania i skończył go (rok temu oczywiście). Wtedy jego czas przeżycia (ilość miesięcy) jest równa 24 czy 12 ?
To na pewno dla Was banalne pytania, proszę o pomoc :lol:
Piszesz, żeby używać survfit z ostrożnością, dlaczego ? Jakieś założenia na stosowanie tej funkcji ?
 
 
     
cogito 
Podporucznik



Pomógł: 30 razy
Posty: 310
Skąd: Wrocław
Wysłany: 2008-06-13, 07:43   

IMHO Jezeli chcesz opisac prawdopodobienstwo zrezygnowania z kursu po 13 miesiacach,
to osobnik ktory nie zrezygnowal z kursu do 12 miesiecy bedzie obserwacja odstajaca bez wzgledu na to czy
- kurs trwa 12 miesiecy,
- kurs trwa 24 miesiace ale wiemy ze do 12 miesiaca nie zrezygnowal
po prostu obserwujemy go 12 miesiecy i tyle wiemy

co do survfit to zaklada sie ze mamy model proporcjonalnych hazardow,
czyli wplywy czynnikow na funkcje przezycia sa stale w czasie
_________________
pozdrawiam
Przemek
www.biecek.pl
 
     
Taos 
Szeregowy


Wiek: 36
Posty: 3
Skąd: Gliwice
Wysłany: 2014-01-20, 00:28   Prosba o pomoc - pytanie

Pozwalam sobie napisać z pewnym pytaniem statsytycznym:

mianowice dokonałem analizy wieloczynnikowej (regresja Coxa).

Chodzi o to że podałem to na jednostke zmiany którą przyjąłem jako 10umol/l dla kreatyniny i 10ml/min/1.73m2 dla GFR.(wskaźnik fiiltracji kłębuszkowej)

dostałem taką odpowiedź recenzenta

" consider presenting hazards per SD; comparing 10 umol rise vs. 10 ml/min change is not particularly useful"


W zwiażaku z tym, że rozkład zmiennych nie spełnia warunków rozkładu normalnego trudno jest mi podać wartość przeliczoną na odchylenie standardowe.
MOje pytanie brzmi czy moge podać wartość na 1 decyl zmiany.

Czylu byłoy tak: Creatinine (per 1 decil change)
eGFR (per 1 decil change)

Problem pojawia się ponieważ mimo wszystko decyle nie dzielą równo grupy zawsze w kilu pojawi się trochę więcej przypadków a w innych o kilka mniej.
Co o tym sądzicie. MOże jest jakaś inna możliwość?
Pozdrawiam
Taos
 
     
mathkit 
Major



Pomógł: 46 razy
Wiek: 34
Posty: 1301
Skąd: Katowice
Wysłany: 2014-01-20, 15:50   

A doprowadzić kreatyniny czy GFR do rozkładu normalnego nie możesz (np. log() nic nie daje)?

To powinno rozwiązać problem i wówczas mógłbyś podawać CI dla hazard ratio w oparciu o standard deviation.
 
 
     
Taos 
Szeregowy


Wiek: 36
Posty: 3
Skąd: Gliwice
Wysłany: 2014-01-20, 20:11   

Bardzo dziękuję. NIestety po zlogarytmowaniu w daslszym ciągu rozkład nie spełnia warunków rozkładu normalnego. Analiza testem Shapiro-Wilk'a.
Może jakiś inny sposób?
Pozdrawiam
Taos
W załączeniu rozkład Kreatyniny.
Próbowałem jeszcze sqrt(x)
ale efekt podobny.

KRP.docx
1 wykres przed zlogarytmowaniem
2 wykres po zlogarytmowaniu
Pobierz Plik ściągnięto 150 raz(y) 43,99 KB

Ostatnio zmieniony przez Taos 2014-01-21, 01:37, w całości zmieniany 3 razy  
 
     
mathkit 
Major



Pomógł: 46 razy
Wiek: 34
Posty: 1301
Skąd: Katowice
Wysłany: 2014-01-21, 10:01   

Zawsze przy dużej skośności możesz użyć transformacji Boxa-Coxa. Problem będzie jednak z interpretacją wyników.
Jak dużą masz próbę. Jakim testem badałeś normalność i jakie p-value?
 
 
     
Taos 
Szeregowy


Wiek: 36
Posty: 3
Skąd: Gliwice
Wysłany: 2014-01-22, 11:05   

Bardzo dziękuję za zainteresowanie tematem.

Próba blisko 3000
Testy - kilka Shapiro, Kolmogorov, Martinez Iglewicz, Omnibus.... p<.0001
Cox-Box próbowałem, ale nie jestem zaznajomiony z ta metodą. Poza tym wg. mojej wiedzy nie mogę wykorzystać tak stransofrmowanej zmiennej do dalszych analiz (np w regresji Coxa).

Generalnie potrzebowałem normalizacji rozkłądu ponieważ chciałem wykrzystać algorytm MICE (Multivariate Imputation by Chained Equations). Znalazłem jednak inną metodę, która nie wymaga założeń co do rozkładu.

Mam natomiast pytanie czy mogę taką zmienną (kreatynina lub log(kreatynina)) wrzucić do regresji Coxa. Może nieco światła na ten rozkład rzuci fakt, że chorzy z niskim wartościami kreatyniny zostali wykluczeni z grupy badanej. Po włączeniu tych chorych rozkład dla zmiennej log(kreatynina) nieco bardziej przypomina rozkład normalny (wizualnie bo testy dalej wskazują na rozkład różny od normalnego, ale pewnie kwestia dużej liczebności grupy).
Bardzo dziękuję.
 
     
Wyświetl posty z ostatnich:   
Odpowiedz do tematu
Nie możesz pisać nowych tematów
Nie możesz odpowiadać w tematach
Nie możesz zmieniać swoich postów
Nie możesz usuwać swoich postów
Nie możesz głosować w ankietach
Nie możesz załączać plików na tym forum
Możesz ściągać załączniki na tym forum
Dodaj temat do Ulubionych zakładek(IE)
Wersja do druku

Skocz do:  

Podobne Tematy
Temat Autor Forum Odpowiedzi Ostatni post
Brak nowych postów Przyklejony: Kurs z analizy przeżycia - Warszawa 17-18 czerwca
scyth Ogłoszenia, sprawy organizacyjne forum, regulamin 0 2008-04-23, 07:46
scyth
Brak nowych postów Przyklejony: Średnia długość życia
ewa11 Teoria estymacji 13 2011-09-08, 19:27
modny_szyk
Brak nowych postów Przyklejony: Sposób obliczania Wskaźników jakości życia
Hora Hyde Park 5 2008-05-07, 20:31
NamelessOne
Brak nowych postów Przyklejony: Analiza trendu
madzias Modelowanie ekonometryczne 7 2009-12-12, 14:30
Shidley
Brak nowych postów Przyklejony: Analiza skupień
Wybór obserwacji podobnych
slide23 Statystyka w badaniach sondażowych rynku 9 2016-10-12, 10:21
wwwmetodologpl

Ideą przyświecającą istnieniu forum statystycznego jest stworzenie możliwości wymiany informacji, poglądów i doświadczeń osób związanych ze statystyką, mierzenie się z różnego rodzaju problemami statystycznymi i aktuarialnymi. Poruszane problemy: Statystyka w badaniach sondażowych rynku, metody reprezentacyjne, Teoria i rachunek prawdopodobieństwa, statystyka opisowa, teoria estymacji, testowanie hipotez statystycznych, ekonometria, prognozowanie, metody data mining.
Copyright (C) 2006-2015 Statystycy.pl
Powered by phpBB modified by Przemo © 2003 phpBB Group
Strona wygenerowana w 3,61 sekund. Zapytań do SQL: 23