Statystyka, prognozowanie, ekonometria, data mining Strona Główna
Reklama pqstat.pl
Statystyka, prognozowanie, ekonometria, data mining
Forum miłośników statystyki - Portal Statystyczny

FAQFAQ  SzukajSzukaj  UżytkownicyUżytkownicy  GrupyGrupy  StatystykiStatystyki
RejestracjaRejestracja  ZalogujZaloguj  Chat   Regulamin  Kadra forum
PORTAL STATYSTYCZNY
 Ogłoszenie 
FORUM STATYSTYCZNE MA JUŻ 10 LAT

Znasz statystykę lub ekonometrię, metody prognozowania, data mining i chcesz pomóc w rozwoju forum statystycznego ?
Pisz na: administrator(małpa)statystycy.pl

Rozpoczął swoją działalność portal statystyczny - masz pomysł na jego rozwój ?

Drogi forumowiczu! Zanim napiszesz posta zapoznaj się z regulaminem forum i przedstaw się
The International Year of Statistics (Statistics2013) Smarter Poland Portal statystyczny
Znalezionych wyników: 12
Statystyka, prognozowanie, ekonometria, data mining Strona Główna
Autor Wiadomość
  Temat: Model ekonometryczny bezrobocia
hans505

Odpowiedzi: 1
Wyświetleń: 28

PostForum: Modelowanie ekonometryczne   Wysłany: 2018-11-14, 20:40   Temat: Model ekonometryczny bezrobocia
Hej,
może to Ci pomoże:
ftp://ftp.zew.de/pub/zew-docs/dp/dp0567.pdf
https://www.reed.edu/econ...4/book/Ch14.pdf

oba źródła po angielsku.
  Temat: Proszę o pomoc
hans505

Odpowiedzi: 5
Wyświetleń: 115

PostForum: Testowanie hipotez statystycznych   Wysłany: 2018-11-13, 20:44   Temat: Proszę o pomoc
Masy dwie zmienne nominalne (3 gatunki ptaków, których nie możesz poukładać od najlepszego do najgorszego oraz 3 środowiska).

Kruskal-Wallis jest dla wartości możliwych przynajmniej do uporządkowania lub z całego R. Jest to ANOVA nieparamateryczna, przydatna, gdy chcemy sprawdzić tezę, czy między grupami zachodzą jakieś istotne różnice w rozkładzie (w wartości średniej). Czyli jak chcemy sprawdzić np. wagę ptaków z podejrzeniem, że w lesie są grubsze niż na łące.
  Temat: Test Grubbsa
hans505

Odpowiedzi: 32
Wyświetleń: 43960

PostForum: Testowanie hipotez statystycznych   Wysłany: 2018-11-09, 20:55   Temat: Test Grubbsa
Mogłabyś podesłać te dane?
Moim zdaniem można logarytmować dane, ale wtedy trzeba na nich operować. Zwłaszcza, że funkcja ln() ma to do siebie, że zmniejsza te odległości między punktami... Właściwie zawsze można machnąć symulację w R: dane z rozkładu normalnego plus sztucznie dodane wartości odstające i testować.

Skąd się biorą te wartości odstające? Zasadniczo wartość odstającą można zdefiniować, jeśli mamy jakiś rozkład, od którego te dane mają odstawać. Czy jest to błąd pomiaru?
  Temat: Test Grubbsa
hans505

Odpowiedzi: 32
Wyświetleń: 43960

PostForum: Testowanie hipotez statystycznych   Wysłany: 2018-11-08, 14:24   Temat: Test Grubbsa
Pierwsza moja myśl, czemu nie weźmiesz mediany? Ona jest przecież bardziej odporna na duże skrajności.

Czy dobrze rozumiem, że nawet po odrzuceniu wartości skrajnych, dane nie pozwalają przyjąć rozkładu normalnego dla populacji?

Moim zdaniem nie do końca jest uprawnione twierdzić, że jeśli logarytm zbioru x nie ma wartości odstających, to także sam zbiór x ich nie ma. Możesz jednak jak najbardziej ze zlogarytmowanym zbiorem wykonywać dalsze analizy zakładające rozkład normalny, na końcu musisz jednak pamiętać, że wynik to lg.
  Temat: Test Grubbsa
hans505

Odpowiedzi: 32
Wyświetleń: 43960

PostForum: Testowanie hipotez statystycznych   Wysłany: 2018-11-08, 12:32   Temat: Test Grubbsa
Hej,
właściwie wymaga się dla testu Grubbsa rozkładu normalnego. Problem polega na tym, że w przypadku małej liczby danych nasi outliersi powodują, że normalność rozkładu trudno jest potwierdzić. Dlatego, często poleca się usunąć z próby potencjalną wartość odstającą i wtedy zrobić test na rozkład normalny.
Polecam Ci Shapiro-Wilka na test. Dodatkowo qqplot z punktami pozwoli samemu ocenić, na ile taki rozkład mógłby być normalny.

Teraz tak, Grubb test sprawdza, czy x(1) lub x(n) są wartością odstającą. Jeśli tak, należałoby usunąć tę wartość i test powtórzyć. Czynność powtarza się tak długo, gdy test nie wykaże wartości odstającej.

Zasadnicze pytanie brzmi, co chcesz dalej z danymi robić. Jeśli przez logarytm uzyskałaś rozkład normalny, być może, możesz używać wartości logarytmowanych.
  Temat: Wyliczanie współczynnika trendu.
hans505

Odpowiedzi: 5
Wyświetleń: 202

PostForum: Metody prognostyczne   Wysłany: 2018-11-06, 11:30   Temat: Wyliczanie współczynnika trendu.
Polecam ten krótki przegląd: http://www.demografia.uni...i_czasowe_I.pdf
tam znajdziesz potrzebne wzory.

Zastanawia mnie, czemu m12 (czyli ostatni aktualny miesiąc?) jest w pierwszej kolumnie. Zazwyczaj szeregi czasowe przedstawia się w kolejności od lewej do prawej (rosnąco). Takie rozwiązanie ma tę zaletę, że jak dojdzie m13, nie będzie problemu go dodać.
  Temat: Dobranie zmiennych diagnostycznych
hans505

Odpowiedzi: 1
Wyświetleń: 118

PostForum: Teoria i rachunek prawdopodobieństwa   Wysłany: 2018-11-05, 22:30   Temat: Dobranie zmiennych diagnostycznych
Czołem,
ładnie opisany jest cały algorytm tutaj:
UE we Wrocławiu (strona 32)


Cytat:
a te dla których wartość r przekracza 0,5 (tak przyjąłem) jest cechą satelitarną.

Czemu właściwie wybrałeś 0,5 (z ciekawości pytam)? 0,5 to tylko średnia zależność (w teście by się dla tych par i tak nie ostała pewnie)

Cytat:

Usuwam je z tabeli i powtarzam. No i też kwestia jeżeli do tego etapu jest dobrze, do kiedy powtarzam? Aż do macierzy 2x2 kiedy nie ma cechy centralnej czy do momentu jak nie ma cech satelitarnych.

Do końca, aż przeanalizujesz wszystkie kolumny. To, co zostanie musi być cechą izolowaną (nie da się ich przypisać żadnej cesze centralnej).

Cytat:
Na załączonym przykładzie na koniec nie wiem WL1 (jest minimalnie większe od WZ7) też dodać jako centralną czy powinienem już zakończyć
.
WL1 i WZ7 mają tę samą wartość, o ile się nie mylę. Jednak nie ma znaczenia, którą kolumnę wybierzesz. W żadnej nie ma rho większego niż 0,5. Wygląda na to, że można zakończyć algorytm z 3 cechami izolowanymi.
  Temat: Wyliczanie współczynnika trendu.
hans505

Odpowiedzi: 5
Wyświetleń: 202

PostForum: Metody prognostyczne   Wysłany: 2018-11-02, 21:25   Temat: Wyliczanie współczynnika trendu.
Hej,
myślałeś o obliczeniu przyrostu sprzedaży dla danego okresu? Możesz też skalkulować średni przyrost sprzedaży w czasie. Teoretycznie możesz także przedstawić trend za pomocą funkcji w ramach analizy szeregów czasowych.

Co do struktury danych, kolumny to miesiące i wielkość sprzedaży / produkcji?
  Temat: wartosc krytyczna, a poziom istotnosci
hans505

Odpowiedzi: 1
Wyświetleń: 61

PostForum: Statystyka opisowa   Wysłany: 2018-11-02, 21:20   Temat: wartosc krytyczna, a poziom istotnosci
Hej,
wartość krytyczna jest zależna od poziomu ufności, jaki przyjmiesz. Jeśli byś wzięła alpha=0,9 (tak to nie pomyłka, skrajny przypadek do zobrazowania), to będzie duuużo łatwiej odrzucić H0, bo i wartość krytyczna byłaby dużo niższa. (Oczywiście sensowne są alpha<=0.1).

R^kwadrat nie tyle zależy od liczby obserwacji, co od dopasowania modelu do danych (prawidłowo ujmując, na ile model wyjaśnia odchylenia danych). Nie znam tego programu (gretl), ale gdybyś z n=10 stworzyła model, a później wzięła 100 nowych obserwacji i ten sam model weryfikowała R^2 to wynik może być diametralnie różny (obstawiam raczej na wzrost niedopasowania modelu) od tego przy n=10. Z tego co kojarzę, w programie SAS każdorazowo dla nowej próby budowany jest nowy model regresji i na jego podstawie obliczane R^2, więc to trochę inna sytuacja.
  Temat: jaki rodzaj testu wybrać?
hans505

Odpowiedzi: 1
Wyświetleń: 169

PostForum: Testowanie hipotez statystycznych   Wysłany: 2018-10-28, 23:31   Temat: jaki rodzaj testu wybrać?
Hej,
moim zdaniem z korelacji nic tu nie wyjdzie, bo masz tylko wartości nominalne (kategoria x: tak/nie).
Dobrze zrozumiałem, że jedna kategoria może należeć tylko do 2 postów? Załóżmy, że masz 100 postów, to minimalnie 50 kategorii? W takim wypadku żadnych zależności nie uchwyci się.

Wydaje mi się, że test Fishera wchodzi w rachubę. Ewentualnie można się pobawić analizą klasyfikacji, ale wtedy trzeba by mieć więcej cech postu, by szacować do jakich kategorii będzie należeć.
  Temat: Test istotności dla wskaźnika struktury dla n<100
hans505

Odpowiedzi: 1
Wyświetleń: 202

PostForum: Testowanie hipotez statystycznych   Wysłany: 2018-10-21, 01:46   Temat: Test istotności dla wskaźnika struktury dla n<100
Jeśli będzie za mało elementów w próbie (n<100 a nawet n<120), to rozkład statystyki testowej U nie będzie asymptotycznie normalny i wyniki testu są obciążone (biased). Alternatywnie można wziąć test dwumianowy (binomialtest) w tym przypadku i wtedy nie trzeba się martwić normalnością rozkładu.
  Temat: Odchylenie standardowe
hans505

Odpowiedzi: 1
Wyświetleń: 229

PostForum: Statystyka opisowa   Wysłany: 2018-10-21, 01:25   Temat: Odchylenie standardowe
Znalazłem już źródło, gdzie poświęcono trochę uwagi Twojemu wzorowi:
statsoft

Pierwsza sprawa, to Qe to jest sigma_e. Natomiast sigma_res (Qres) odnosi się do rezerw, nie do kursu.

Co do konkretów, musisz określić okres objęty próbą, z tego co wnioskuję po wzorze, warto by był większy niż dwa lata Dla tego okresu musisz mieć dane na każdy miesiąc.
Odchylenie standardowe, to jest nic innego jak pierwiastek z uśrednionej sumy odchyleń kwadratowych, czyli różnicy między kursem z miesiąca t a średnią z całego okresu.

Powiedzmy, że Twoim okresem są lata 2015-2017 (n=36, t={1,..,n}). Wyliczasz średnią kursu i rezerw z całego okresu próby, czyli 36 miesięcy.

Powiedzmy 01.2017 odpowiada t=25
wtedy potrzebujemy:
1. średnią kursu z całego okresu
2. odchylenie standardowe kursu z całego okresu
3. dane za styczeń 2017 (e_25) oraz dane za styczeń 2016 (e_13)
Analogicznie co do rezerw. Wstawiasz do wzoru. Proces ten powtarzamy dla wszystkich t>12.

Później zgodnie ze źródłem wyliczasz średnią tego indeksu (sumujesz wszystkie I od I_1 do I_36) oraz jego odchylenie standardowe i szukasz takiego miesiąca, w którym indeks I był większy niż średnia + p*odchylenia standardowego, przy czym p wcześniej musi być ustalone (zazwyczaj między 1,5 a 3).

Co do zastosowania w kontekście tematu nie mogę się wypowiedzieć, bo to nie moja branża, ale wydaje mi się to wskaźnikiem ex post.
 
Skocz do:  
Ideą przyświecającą istnieniu forum statystycznego jest stworzenie możliwości wymiany informacji, poglądów i doświadczeń osób związanych ze statystyką, mierzenie się z różnego rodzaju problemami statystycznymi i aktuarialnymi. Poruszane problemy: Statystyka w badaniach sondażowych rynku, metody reprezentacyjne, Teoria i rachunek prawdopodobieństwa, statystyka opisowa, teoria estymacji, testowanie hipotez statystycznych, ekonometria, prognozowanie, metody data mining.
Copyright (C) 2006-2015 Statystycy.pl
Powered by phpBB modified by Przemo © 2003 phpBB Group
Strona wygenerowana w 0,06 sekundy. Zapytań do SQL: 15