Statystyka, prognozowanie, ekonometria, data mining Strona Główna
Reklama pqstat.pl
Statystyka, prognozowanie, ekonometria, data mining
Forum miłośników statystyki - Portal Statystyczny

FAQFAQ  SzukajSzukaj  UżytkownicyUżytkownicy  GrupyGrupy  StatystykiStatystyki
RejestracjaRejestracja  ZalogujZaloguj  Chat   Regulamin  Kadra forum
PORTAL STATYSTYCZNY
 Ogłoszenie 
FORUM STATYSTYCZNE MA JUŻ 10 LAT

Znasz statystykę lub ekonometrię, metody prognozowania, data mining i chcesz pomóc w rozwoju forum statystycznego ?
Pisz na: administrator(małpa)statystycy.pl

Rozpoczął swoją działalność portal statystyczny - masz pomysł na jego rozwój ?

Drogi forumowiczu! Zanim napiszesz posta zapoznaj się z regulaminem forum i przedstaw się
The International Year of Statistics (Statistics2013) Smarter Poland Portal statystyczny

Poprzedni temat «» Następny temat

Tagi tematu: biblioteki r, funkcja lm, grupa uzytkownikow r, pakiety r, program r

Przesunięty przez: mathkit
2015-03-23, 16:03
[R] Prostej regresja liniowa - lm()
Autor Wiadomość
markar7 
Szeregowy


Posty: 2
Skąd: Warszawa
Wysłany: 2010-04-08, 18:10   [R] Prostej regresja liniowa - lm()

Witam,
Mam do stworzenia prostą regresję dla dwóch ciągów danych znajdujących się w dwóch plikach. W jednym pliku znajdują się prognozy, w drugim rzeczywiste pomiary. W obydwu plikach są to ciągi danych w dwóch kolumnach V1 (data pomiaru) i V2 (wartość pomiaru). Udało mi się wczytać dane z obydwu plików (za pomocą funkcji read.table), tak że po ich wywołaniu dane się wyświetlają, natomiast nie wiem jak z tych danych skorzystać do budowy funkcji regresji. Wiem, że trzeba użyć funkcji lm(), ale kombinuję i po prostu nie wiem jak korzystać z danych z dwóch plików itd....
Ostatnio zmieniony przez mathkit 2015-04-10, 18:11, w całości zmieniany 3 razy  
 
 
     
Google

Wysłany:    Reklama google.

 
 
Crunchy 
Major
Crunchy


Pomógł: 75 razy
Posty: 1129
Skąd: Katowice
Wysłany: 2010-04-08, 19:50   

Kod:
dane_z_pierwszego_pliku<-read.table("plik_1")
dane_z_drugiego<-read.table("plik_2")
lm(dane_z_pierwszego_pliku$V2~dane_z_drugiego$V2)
 
     
markar7 
Szeregowy


Posty: 2
Skąd: Warszawa
Wysłany: 2010-04-09, 16:39   

No właśnie o to mi chodziło. Dzięki... Można się było spodziewać, że to będzie dosyć proste... Jeśli jeszcze dostałbym informację jak zrobić do tego wykres to byłbym totalnie szczęśliwy .... Pozdrawiam
 
 
     
Crunchy 
Major
Crunchy


Pomógł: 75 razy
Posty: 1129
Skąd: Katowice
Wysłany: 2010-04-10, 10:18   

Kod:
?plot
plot(lm(dane_z_pierwszego_pliku$V2~dane_z_drugiego$V2))
regresja<-lm(dane_z_pierwszego_pliku$V2~dane_z_drugiego$V2)
regresja
plot(regresja)
summary(regresja)

Wygodniej jest tworzyć nowe obiekty.
Kod:
prognozy<-dane_z_pierwszego_pliku$V2
wyniki<-dane_z_drugiego$V2
reg<-lm(prognozy~wyniki)
 
     
Gregu 
Szeregowy


Posty: 2
Skąd: Kraków
Wysłany: 2010-09-10, 13:08   [R] Wykresy przy prostej regresji liniowej

Witam, korzystam ze środowiska R, aby stworzyć analize regresji (wydatki na alkohol, wyroby tytoniowe i narkotyki na 1os w zł w zależności od przeciętnego miesięcznego dochodu na 1os w gospodarstwie domowym w latach 1998-2008). Stworzyłem najprostszy wykres regresji i tutaj nasuwa mi się pierwsze pytanie - jak stworzyć 90-95% przedział ufności? Potrzebuje jednak stworzyć więcej wykresów dotyczących badanego zjawiska i tak przewertowując różne strony internetowe natknałem się na publikacje pana Komsty. Znalazłem tam ciekawą funkcję, gdzie po wpisaniu formuły: "par(mfrow=c(2,2));plot(mojaregresja);par(mfrow=c(1,1))" pojawiają się cztery wykresy. Niestety nie do końca rozumiem trzy z nich:

1) wykres kwantylowy-normalny reszt regresji
Czy na jego podstawie można określić czy spełnione jest założenie o normalności rozkładu reszt? Układają się one rosnąco wzdłuż ścieżki, bez żadnych drastycznych odstępstw. Czy trzeba badać to testem Shapiro-Wilka i sprawdzać wartość p-value? Nie do końca to rozumiem..

2) Wykres "Scale-Location" - w ogóle nie mam pojęcia do czego prowadzi... tzn. do jakich wniosków można dojść na jego podstawie...

3) Wykres Residuals vs Leverage
Pozwala dostrzec obserwacje nietypowe i odstające? Rozumiem, że jeśli na wykresie jakaś wartość przekroczy granice "0,5" to jest podejrzana o bycie wartością odstającą? Czy wtedy można już śmiało stwierdzić, że takowa taką na pewno jest?

Jeśli znacie jeszcze jakieś "w miare proste" wykresy, które mogą się przydać przy takiej analizie regresji bardzo prosiłbym o pomoc w stworzeniu ich w środowisku R. Z góry dziękuję za pomoc, każdą, bo wiem, że sam orłem nie jestem, ale trzeba się uczyć. Choć przyznam że sporo przewertowałem i mam trochę mentlik w głowie..
 
     
Crunchy 
Major
Crunchy


Pomógł: 75 razy
Posty: 1129
Skąd: Katowice
Wysłany: 2010-09-12, 00:36   Re: [R] Wykresy przy prostej regresji liniowej

Gregu napisał/a:
1) wykres kwantylowy-normalny reszt regresji
Czy na jego podstawie można określić czy spełnione jest założenie o normalności rozkładu reszt? (...) Czy trzeba badać to testem Shapiro-Wilka i sprawdzać wartość p-value?

Można, ale testować też nie zaszkodzi. ;-)
Gregu napisał/a:
2) Wykres "Scale-Location" - w ogóle nie mam pojęcia do czego prowadzi... tzn. do jakich wniosków można dojść na jego podstawie...

Wariancja reszt powinna być stała, czyli idealnie jak na wykresie jest linia pozioma.
Gregu napisał/a:
3) Wykres Residuals vs Leverage
Pozwala dostrzec obserwacje nietypowe i odstające? Rozumiem, że jeśli na wykresie jakaś wartość przekroczy granice "0,5" to jest podejrzana o bycie wartością odstającą? Czy wtedy można już śmiało stwierdzić, że takowa taką na pewno jest?

Być może, ale śmiało na pewno nie...
 
     
Gregu 
Szeregowy


Posty: 2
Skąd: Kraków
Wysłany: 2010-09-12, 21:01   

Przewertowałem jeszcze wiele stron internetowych i rozjaśniłem umysł, niemniej jednak dzięki za pomoc ;-)
 
     
axxxon 
Szeregowy


Posty: 3
Skąd: Warszawa
Wysłany: 2011-10-25, 21:53   funkcja regresji liniowej z r

Witam!
Jako swoje pierwsze życiowe doświadczenie z r mam do realizacji następujące zadanie: dla
x <-c(0.5,1,1.5,2,2.5,3,3.5,4,4.5,5) oraz
y <-c(0.72,0.11,0.6,1.64,1.91,3.28,4.26,3.32,5,5.25)

muszę:
a ) zbadać czy istnieje między nimi zależność
b ) opisać tę zalezność za pomocą funkcji regresji liniowej
c ) wyznaczyć ile wyniesie przeciętnie wartość dla yi dla xi = 3000
d ) wyznaczyć ile może wynieść yi dla xi = 3000 (chodzi tu o okreslenie przedziałó ufność dla funkcji)

a za zadanie zabieram się w nastepujący sposób:
podaje zadane wektpry
następnie postępuje według komend:
> plot(x,y)
> summary(x)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.500 1.625 2.750 2.750 3.875 5.000
> summary(y)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.110 0.950 2.595 2.609 4.025 5.250
> fit <-lm(x ~y)
> abline(fit)
> summary(fit)
tylko w tym momencie nie wiem co zrobić dalej, jak wyznaczyć funkcje regresji i jej przedziały ufności za pomocą r?
 
     
piotrek 
Podporucznik


Pomógł: 13 razy
Posty: 198
Skąd: b.d.
Wysłany: 2011-10-26, 07:57   

x to na pewno zmienna niezależna?

Funkcja wyznaczona:

Kod:
summary(fit)
Coefficients:
            Estimate Std. Error t value Pr(>|t|)   
(Intercept)  0.73392    0.26070   2.815   0.0227 * 
y            0.77274    0.08256   9.360 1.39e-05 ***


x=0.73392+0.77274y
 
     
axxxon 
Szeregowy


Posty: 3
Skąd: Warszawa
Wysłany: 2011-10-27, 21:00   

jak w takim razie obliczyć wartości funkcji dla 3000 i przedziały ufności dla tej wartości?
 
     
Frank100 
Szeregowy


Posty: 2
Skąd: Kraków
Wysłany: 2015-02-18, 13:46   

Dzień dobry
Czy mogą prosić Szanownych Forumowiczów o pomoc w ustaleniu równania normalnego regresji wielorakiej dla czterech zmiennych objaśniających (x1-X4). Nie wiem jak ma wyglądać takie równanie.
Franek
 
     
Wyświetl posty z ostatnich:   
Odpowiedz do tematu
Nie możesz pisać nowych tematów
Możesz odpowiadać w tematach
Nie możesz zmieniać swoich postów
Nie możesz usuwać swoich postów
Nie możesz głosować w ankietach
Nie możesz załączać plików na tym forum
Możesz ściągać załączniki na tym forum
Dodaj temat do Ulubionych zakładek(IE)
Wersja do druku

Skocz do:  

Podobne Tematy
Temat Autor Forum Odpowiedzi Ostatni post
Brak nowych postów Przyklejony: regresja II rodzaju a regresja ortogonalna
Bobrowska Modelowanie ekonometryczne 0 2010-02-03, 18:13
Bobrowska
Brak nowych postów Przyklejony: korelacja liniowa czy rangowa?
mam problem z adaniem nie wiem jaki wspólczynnik korelacji zastosować
tanali Statystyka opisowa 39 2015-05-14, 06:46
jabol
Brak nowych postów Przyklejony: regresja logistyczna
analiza składowych głównych
green power Teoria estymacji 44 2014-12-18, 14:40
mathkit
Brak nowych postów Przyklejony: regresja logistyczna
mathkit Testowanie hipotez statystycznych 21 2011-11-11, 09:13
Crunchy
Brak nowych postów Przyklejony: Regresja krzywoliniowa
Pomocy!
rob123 Modelowanie ekonometryczne 7 2011-11-18, 22:48
mathkit

Ideą przyświecającą istnieniu forum statystycznego jest stworzenie możliwości wymiany informacji, poglądów i doświadczeń osób związanych ze statystyką, mierzenie się z różnego rodzaju problemami statystycznymi i aktuarialnymi. Poruszane problemy: Statystyka w badaniach sondażowych rynku, metody reprezentacyjne, Teoria i rachunek prawdopodobieństwa, statystyka opisowa, teoria estymacji, testowanie hipotez statystycznych, ekonometria, prognozowanie, metody data mining.
Copyright (C) 2006-2015 Statystycy.pl
Powered by phpBB modified by Przemo © 2003 phpBB Group
Strona wygenerowana w 0,19 sekundy. Zapytań do SQL: 25