Statystyka, prognozowanie, ekonometria, data mining Strona Główna
Reklama pqstat.pl
Statystyka, prognozowanie, ekonometria, data mining
Forum miłośników statystyki - Portal Statystyczny

FAQFAQ  SzukajSzukaj  UżytkownicyUżytkownicy  GrupyGrupy  StatystykiStatystyki
RejestracjaRejestracja  ZalogujZaloguj  Chat   Regulamin  Kadra forum
PORTAL STATYSTYCZNY
 Ogłoszenie 
FORUM STATYSTYCZNE MA JUŻ 10 LAT

Znasz statystykę lub ekonometrię, metody prognozowania, data mining i chcesz pomóc w rozwoju forum statystycznego ?
Pisz na: administrator(małpa)statystycy.pl

Rozpoczął swoją działalność portal statystyczny - masz pomysł na jego rozwój ?

Drogi forumowiczu! Zanim napiszesz posta zapoznaj się z regulaminem forum i przedstaw się
The International Year of Statistics (Statistics2013) Smarter Poland Portal statystyczny
Znalezionych wyników: 129
Statystyka, prognozowanie, ekonometria, data mining Strona Główna
Autor Wiadomość
  Temat: R_zmienna_x_numeryczna?
Lady Tilly

Odpowiedzi: 0
Wyświetleń: 3106

PostForum: Data Mining, Metody klasyfikacji   Wysłany: 2010-07-03, 20:30   Temat: R_zmienna_x_numeryczna?
Dane są pliki tak jak w zadaniu tym http://www.statystycy.pl/t2836_r-gdzie_blad%3F.php
kod:

> p<-function(dane, proba) {
+ d<-dane[,4]
+ D<-max(d)
+ dane_s<-dane[proba,]
+ xs<-dane_s[,2]
+ ys<-dane_s[,3]
+ ds<-dane_s[,4]
+ d_ciag<-levels(factor(d))
+ dane_r<-dane[(- proba),]
+ dr<-dane_r[,4]
+ sumxrd_ciag<-rowsum((dane_r[,2]),dr, reorder=FALSE)
+
+ nd_ciag<-rep(NA,D)
+ ssxsd_ciag<-rep(NA,D)
+ sumysd_ciag<- rep(NA,D)
+ sumxysd_ciag<- rep(NA,D)
+ for (i in 1:D) {
+ dane_sd<-dane_s[(dane_s[,4]==i),]
+ nd_ciag[i]<-nrow(dane_sd)
+ ssxsd_ciag[i]<-sum((dane_sd[,2])^2)
+ sumysd_ciag[i]<-sum(dane_sd[,3])
+ sumxysd_ciag[i]<-sum(dane_sd[,2]*dane_sd[,3])
+ }
+
+ library(nlme)
+ vc<-VarCorr( lme( ys~ xs - 1, random= ~ xs -1 |ds) )
+ esig2_v<-as.numeric(vc[1,1])
+ esig2_e<-as.numeric(vc[2,1])
+
+ b_ciag<-esig2_e+esig2_v*ssxsd_ciag
+ bodw_ciag<-(1/b_ciag)
+ b_m2_ciag<-b_ciag^(-2)
+ b_m3_ciag<-b_ciag^(-3)
+
+ ebeta1<-(sum(ssxsd_ciag*bodw_ciag))^(-1)
+ ebeta2<-sum(sumxysd_ciag*bodw_ciag)
+ ebeta<-ebeta1*ebeta2
+ pred<-matrix(NA,ncol=D,nrow=1)
+ eMSE<-matrix(NA,ncol=D,nrow=1)
+
+ b1<-sum(((nd_ciag-1)/(esig2_e^2))+ b_m2_ciag)
+ b2<-sum(b_m2_ciag*(ssxsd_ciag^2))
+ b3<-sum(b_m2_ciag*ssxsd_ciag)
+ b<-b1*b2-b3^2
+
+ Ivv<-(2/b)*b2
+ Ive<-(2*b)*b3
+ Iee<-(2/b)*b1
+
+ nawias<-( (esig2_v^2)*Ivv - 2*esig2_e*esig2_v*Ive+(esig2_e^2)*Iee)
+
+ for (i in 1:D) {
+ d_w<-d_ciag[i]
+ Nd_w<-nrow(dane[(dane[,4]==d_w),])
+ nd_w<-nrow(dane_s[(dane_s[,4]==d_w),])
+ Nrd_w<-Nd_w - nd_w
+ sumysd_w<-sumysd_ciag[i]
+ sumxrd_w<-sumixrd_ciag[i]
+ bodw_w<-bodw_ciag[i]
+ sumxysd_w<-sumxysd_ciag[i]
+ ssxsd_w<-ssxsd_ciag[i]
+ b_m3_w<-b_m3_ciag[i]
+
+ pred[i]<-sumysd_w +sumxrd_w *ebeta +bodw_w * esig2_v * sumxrd_w * (sumxysd_w - ebeta* ssxsd_w)
+ eg1<-Nrd_w*esig2_e
+ +esig2_e*esig2_v*bodw_w*(sumxrd_w^2)
+ eg2<-ebeta1*(esig2_e*bodw_w*sumxrd_w)^2
+ eg3<-(sumxrd_w^2)*ssxsd_w* b_m3_w*nawias
+
+ eMSE[i]<-eg1+eg2+2*eg3
+ }
+ wyniki<-matrix(c(pred,eMSE), nrow=2, ncol=D, byrow =TRUE)
+ nazwa<-list(c("predyktor","ocena MSE"),c(1:D))
+ dimnames(wyniki)<-nazwa
+ wyniki
+ }
>
> s<-c(15,16,21,25,30,34,36)
> p(dane,s)
Error in rowsum.default((dane_r[, 2]), dr, reorder = FALSE) :
'x' must be numeric
>

o co chodziz xem?

[ Dodano: 2010-07-04, 11:22 ]
już wiem jak ma być
na początku zabrakło
dane<-as.data.frame(dane)
hahaha człowiek się uczy :mrgreen: na swoich błędach :lol:
  Temat: R-gdzie błąd?
Lady Tilly

Odpowiedzi: 6
Wyświetleń: 8722

PostForum: Data Mining, Metody klasyfikacji   Wysłany: 2010-07-02, 21:44   Temat: R-gdzie błąd?
ok - dzięki moje przeoczenie, gapa ze mnie - jeszcze raz dzięki - punkcika masz ode mnie. W tej chwili jestem w Pile - wrócę do domu to będę "walczyć" :mrgreen:
  Temat: R-gdzie błąd?
Lady Tilly

Odpowiedzi: 6
Wyświetleń: 8722

PostForum: Data Mining, Metody klasyfikacji   Wysłany: 2010-07-02, 13:22   Temat: R-gdzie błąd?
Znów pojawia się
Error in `[.default`(dane_s, , 4) : incorrect number of dimensions
Jeśli natomiast wrócę do formy pliku txt to wyświetla się to
Error in `[.data.frame`(dane_s, dane_s[, 4] == d_w) :
undefined columns selected
Załączyłam do posta dwa pliki spakowane w rar
to jest w zasadzie to samo tyle, ze jeden txt drugi to csv
może tam tkwi problem w połączeniu z kodami R
  Temat: R-gdzie błąd?
Lady Tilly

Odpowiedzi: 6
Wyświetleń: 8722

PostForum: Data Mining, Metody klasyfikacji   Wysłany: 2010-07-02, 11:11   Temat: R-gdzie błąd?
Jeśli w formule ysd<-dane_sd[,3] za trójkę wstawię czwórkę - wynik się pojawia ale zupełnie nie o taki mi chodzi.
Jeśli natomiast zamiast pliku w formacie txt przerobię go na csv, którego R doskonale odczytuje to pojawia się błąd taki
Error in `[.default`(dane_s, , 4) : incorrect number of dimensions
myślałam, że licho tkwi w kolumnach i wierszach ale powinno być ok
wydaje mi się, że błąd jest w formule dane_sd<-dane_s[(dane_s[,4]==d_w),] :-/ :-?
  Temat: R-gdzie błąd?
Lady Tilly

Odpowiedzi: 6
Wyświetleń: 8722

PostForum: Data Mining, Metody klasyfikacji   Wysłany: 2010-07-01, 16:33   Temat: R-gdzie błąd?
> est_zw<-function(dane,proba,d_w) {
+ dane_s<-dane[proba,]
+ dane_sd<-dane_s[(dane_s[,4]==d_w),]
+ dane_r<-dane[-(proba),]
+ dane_rd<-dane_r[(dane_r[,4]==d_w),]
+ nd<-nrow(dane_sd)
+ if (nd==0) stop("liczebnosc elementow domeny w probie wynosi 0")
+ Nrd<-nrow(dane_rd)
+ Nd<-nd+Nrd
+ N<-nrow(dane)
+ n<-nrow(dane_s)
+ ysd<-dane_sd[,3]
+ est<-Nd*sum(ysd)/nd
+ a<-(Nd/(N*nd/n))^2
+ b<-((N^2)*(N-n)*(nd-1))/(n*N*(n-1))
+ v<-var(ysd)
+ estD2<-a*b*v
+ estD<-estD2^0.5
+ estgam<-100*estD/est
+ wynik<-matrix(c(est,estD2,estD,estgam),ncol=1)
+ wynik<-formatC(wynik,format="f")
+ nazwa<-list(c("estymator","ocena wariancji estymatora","ocena średniego błędu szacunku","ocena względnego błędu szacunku"),c("wartość"))
+ dimnames(wynik)<-nazwa
+ wynik
+ }
>
> zbior<-read.table("c:/dane.txt", header=TRUE)
> s<-c(15,16,21,25,30,34,36)
> est_zw(zbior,s,3)
Error in Summary.factor(c(17L, 12L, 11L, 14L, 19L), na.rm = FALSE) :
sum not meaningful for factors
>
  Temat: Konferencje, SKAD-y,...
Lady Tilly

Odpowiedzi: 0
Wyświetleń: 3682

PostForum: Ogłoszenia, sprawy organizacyjne forum, regulamin   Wysłany: 2010-06-28, 15:29   Temat: Konferencje, SKAD-y,...
Chciałam zaproponować temat dotyczący konferencji innych niż WZUR. Myślę, ze do jednej z ważnych bardzo konferencji należy SKAD. W zeszłym roku odbyła się w Międzyzdrojach.
"była to już XXIII Konferencja Takso-nomiczna) nt. Klasyfikacja i analiza danych – teoria i zastosowania organizowana przez Sekcję Klasyfikacji i Analizy Danych Polskiego Towarzystwa Statystycznego i Katedrę Ubezpieczeń i Rynków Kapitałowych Uniwersytetu Szczecińskiego. Przewodniczącym Komitetu Organizacyjnego Konferencji był prof. dr hab. Waldemar Tarczyński, natomiast sekretarzem dr Małgorzata Tarczyńska-Łuniewska.
Zakres tematyczny konferencji obejmował zagadnienia:
a)teoria (taksonomia, analiza dyskryminacyjna, metody porządkowania liniowego, meto-dy statystycznej analizy wielowymiarowej, metody analizy zmiennych ciągłych, metody analizy zmiennych dyskretnych, metody analizy danych symbolicznych, metody graficzne),
b)zastosowania (analiza danych finansowych, analiza danych marketingowych, analiza danych przestrzennych, inne zastosowania analizy danych – medycyna, psychologia, arche-ologia, itd., aplikacje komputerowe metod statystycznych). Jeśli kogoś interesują szczeóły z tej z Międzyzdrojów to proszę pytać.
Zasadniczym celem konferencji SKAD była prezentacja osiągnięć i wymiana doświadczeń z zakresu teoretycznych i aplikacyjnych zagadnień klasyfikacji i analizy danych. Konferencja stanowi coroczne forum służące podsumowaniu obecnego stanu wiedzy, przedstawieniu i promocji dokonań nowatorskich oraz wskazaniu kierunków dalszych prac i badań." Głównymi prowodyrami i autorami sprawozdania byli KRZYSZTOF JAJUGA, WALDEMAR TARCZYŃSKI, MAREK WALESIAK
Z własnej strony dla zainteresowanych jeśli będą jakoweś pytania - mogę odpowiedzieć. Kolejna tego typu konferencja będzie w Toruniu. Relację zdam "własnoręcznie". :-P
  Temat: Test Grubbsa
Lady Tilly

Odpowiedzi: 32
Wyświetleń: 46063

PostForum: Testowanie hipotez statystycznych   Wysłany: 2009-10-23, 20:35   Temat: Test Grubbsa
Dobrze główkujesz ponieważ wartość krytyczna statystyki tego testu obliczana jest na podstawie parametru t rozkładu Studenta dla zadanego poziomu ufności i liczby stopni swobody (n - 2, n - liczba pomiarów w serii). Poza tym podobny problem był
tutaj omawiany
  Temat: Szachy
Lady Tilly

Odpowiedzi: 2
Wyświetleń: 5833

PostForum: Hyde Park   Wysłany: 2009-10-12, 13:06   Temat: Szachy
Zgubił mnie hetman w drugim ruchu. Dzięki - miałam dość podobny tok. Obstawiałam na hetmana lub na skoczka w drugim ruchu a to trzeba było w trzecim zrobić hehehe - thx wielkie dzięki. Jeśli będę miała jeszcze jakieś fajne zadanko to podeślę.
  Temat: Mediana
Lady Tilly

Odpowiedzi: 110
Wyświetleń: 122725

PostForum: Statystyka opisowa   Wysłany: 2009-10-03, 14:10   Temat: Mediana
Polega to na sporządzeniu w układzie współrzędnych prostokątnych wykresu szeregu skumulowanego, tzw. krzywej ogiwalnej. Aby tę krzywą wykreślić, łączy się skumulowane liczebności z górnymi kresami przedziałów klasowych. Następnie na osi rzędnych zaznacza się n/2 i z punktów tych kreśli proste równoległe do osi x, które przecinają krzywą ogiwalną. Punkty przecięcia tych prostych krzywą liczebności kumulacyjnej rzutuje się na oś x i w ten sposób wyznaczona zostaje mediana czyli kwartyl środkowy.
  Temat: Test t studenta dla dwóch średnich
Lady Tilly

Odpowiedzi: 178
Wyświetleń: 201520

PostForum: Testowanie hipotez statystycznych   Wysłany: 2009-09-28, 21:04   Temat: Test t studenta dla dwóch średnich
1) Test istotności dwóch średnich wygląda następująco:

Tutaj ,usisz tylko zformułować hipotezy.
2) przedział ufności dla odsetka w populacji o rozkładzie normalnym N(m, σ)
  Temat: Szachy
Lady Tilly

Odpowiedzi: 2
Wyświetleń: 5833

PostForum: Hyde Park   Wysłany: 2009-09-25, 10:52   Temat: Szachy
Temat nawiązuje trovhę to tematu mola ksiażkowego. W związku z tym, że na różnych portalach istnieją turnieje szachowe, żeby się nie dublować stwierdziłam, że dobrym pomysłem byłoby zapodawanie dla ćwiczenia umysłu - kilkuruchówek.

Białe dają mata czarnym w czterech ruchach.
  Temat: Test istotności współczynnika korelacji
Lady Tilly

Odpowiedzi: 104
Wyświetleń: 138382

PostForum: Testowanie hipotez statystycznych   Wysłany: 2009-09-07, 08:57   Temat: Test istotności współczynnika korelacji
Korzystasz ze statystyki:

b to współczynnik regresji s odchylenie standardowe

ta to wartość krytyczna ustalona z rozkładu t-Studenta o n-2 stopniach swobody oraz 1-a poziomie ufności.
  Temat: Test t dla prób zależnych
Lady Tilly

Odpowiedzi: 54
Wyświetleń: 75412

PostForum: Testowanie hipotez statystycznych   Wysłany: 2009-08-24, 07:48   Temat: Test t dla prób zależnych
Korzystasz ze wzoru:

choć tak jak piszesz - możesz skorzyctać z estymatora nieobciążonego
- tutaj wykorzystuje się funkcje gamma - estymator przez swoje nieobciążenie jest dokładniejszy - więc to zależy jaki chcesz otrzymać.
  Temat: Projekty zaliczeniowe
Lady Tilly

Odpowiedzi: 98
Wyświetleń: 105154

PostForum: Statystyka opisowa   Wysłany: 2009-08-12, 14:06   Temat: Re: Proźba o pomoc w rozwiązaniu zadań
dosiek napisał/a:

zadanie 1
Dowolne dane z obszaru administracji...

Tutaj możesz skorzystać z Banku Danych Regionalnych
dosiek napisał/a:
...opisać za pomocą procentu i punktu procentowego (badania z grupy pełnych, dane na przykład z roczników statystycznych). PUNKT PROCENTOWY. Należy przeprowadzić wszechstronną analizę struktury badanej zbiorowości ze względu na jakąś cechę dla dowolnie dobranej małej próby statystycznej z obszau administracji (składniki zadania: SZEREG, TABELA, WYKRES, ŚREDNIA, ZMIENNOŚĆ, SKOŚNOŚĆ, KURTOZA)


Jeśli chodzi o miary, o które w zadaniach wspomniano - możesz powyszukiwać o nich na forum - na przykład:
1) Dominanta
2) Mediana
3) Asymetria
4) Kurtoza
5) Średina
no i temat bardziej do opisowej chyba pasuje - prawda?
  Temat: Dowód Fibonacci - Forex - systemy i strategie
Lady Tilly

Odpowiedzi: 8
Wyświetleń: 14095

PostForum: Teoria i rachunek prawdopodobieństwa   Wysłany: 2009-08-12, 08:00   Temat: Dowód Fibonacci - Forex - systemy i strategie
Wydaje mi się, że można kombinować z łańcuchem Markowa - być może zadanie nie jest bezpośrednim odwzorowaniem łańcucha - może jednak okazać się przydatne.
 
Strona 1 z 9
Skocz do:  
Ideą przyświecającą istnieniu forum statystycznego jest stworzenie możliwości wymiany informacji, poglądów i doświadczeń osób związanych ze statystyką, mierzenie się z różnego rodzaju problemami statystycznymi i aktuarialnymi. Poruszane problemy: Statystyka w badaniach sondażowych rynku, metody reprezentacyjne, Teoria i rachunek prawdopodobieństwa, statystyka opisowa, teoria estymacji, testowanie hipotez statystycznych, ekonometria, prognozowanie, metody data mining.
Copyright (C) 2006-2015 Statystycy.pl
Powered by phpBB modified by Przemo © 2003 phpBB Group
Strona wygenerowana w 0,21 sekundy. Zapytań do SQL: 15