Statystyka, prognozowanie, ekonometria, data mining Strona Główna
Reklama pqstat.pl
Statystyka, prognozowanie, ekonometria, data mining
Forum miłośników statystyki - Portal Statystyczny

FAQFAQ  SzukajSzukaj  UżytkownicyUżytkownicy  GrupyGrupy  StatystykiStatystyki
RejestracjaRejestracja  ZalogujZaloguj  Chat   Regulamin  Kadra forum
PORTAL STATYSTYCZNY
 Ogłoszenie 
FORUM STATYSTYCZNE MA JUŻ 10 LAT

Znasz statystykę lub ekonometrię, metody prognozowania, data mining i chcesz pomóc w rozwoju forum statystycznego ?
Pisz na: administrator(małpa)statystycy.pl

Rozpoczął swoją działalność portal statystyczny - masz pomysł na jego rozwój ?

Drogi forumowiczu! Zanim napiszesz posta zapoznaj się z regulaminem forum i przedstaw się
The International Year of Statistics (Statistics2013) Smarter Poland Portal statystyczny

Poprzedni temat «» Następny temat

Tagi tematu: Brak tagów.

analiza skupień
Autor Wiadomość
luccassd 
Szeregowy


Posty: 3
Skąd: Warszawa
Wysłany: 2008-07-25, 14:54   analiza skupień

Witam,

Jestem tu nowy i w dodatku ze statystyką nie miałem do czynienia od wielu lat.

Mam teraz problem do rozwiązania i nawet nie wiem czy piszę na dobrym forum - jeśli nie to odeślijcie mnie do właściwego.

Mój problem do rozwiązania:
- mam listę firm z ich miesięcznymi obrotami w PLN,
- do każdej firmy mam osiągnięty wynik w miesiącu w % (zysk lub strata)
- tych firm na liście jest ok 2.000

Generalnie jest tak, że im większe obroty tym mniejszy zysk w % ale:
- muszę te firmy podzielić na grupy wg obrotu w których wynik jest podobny i za razem różny od firm w kolejnej grupie.
Nie wiem ile tych grup ma być - sam to muszę określić. Może tak być, że nie da się podzielić na takie grupy ale tego nie wiem.

Chyba muszę użyć jakiegoś testu statystycznego ale tu proszę o pomoc jak to zrobić?

Bardzo proszę o pomoc!

Z góry dziękuję :)
Ostatnio zmieniony przez mathkit 2008-07-26, 12:44, w całości zmieniany 1 raz  
 
     
Google

Wysłany:    Reklama google.

 
 
cogito 
Podporucznik



Pomógł: 30 razy
Posty: 310
Skąd: Wrocław
Wysłany: 2008-07-25, 19:44   

do tego zagadnienia wykorzystalbym metody analizy skupien
choc w jednowymiarowym przypadku to troche strzelanie do muchy z armaty

w kazdym razie jezeli przyjmiesz ze wiesz na ile grup chcesz podzielic cala populacje, to problem sprowadza sie do znalezienia granicy tych grup, takiej zeby odleglosci pomiedzy obiektami w grupach byly mozliwie male w stosunku do odleglosci pomiedzy obiektami pomiedzy grupami (zwykla optymalizacja)

poniewaz nie wiesz ile chcesz miec klas to wykonaj powyzsza optymalizacje dla 2 klas, 3 klas 4 klas .... nastepnie na wykresie narysuj iloraz odleglosci intra/inter i wybierz (organoleptycznie) najlepsza liczbe klas
_________________
pozdrawiam
Przemek
www.biecek.pl
 
     
luccassd 
Szeregowy


Posty: 3
Skąd: Warszawa
Wysłany: 2008-07-25, 20:00   

dzięki - trochę rozumiem

ale co dokładnie kryje się za "nastepnie na wykresie narysuj iloraz odleglosci intra/inter i wybierz (organoleptycznie) najlepsza liczbe klas"?

mógłbyś wyjaśnić?
 
     
cogito 
Podporucznik



Pomógł: 30 razy
Posty: 310
Skąd: Wrocław
Wysłany: 2008-07-26, 09:29   

''nastepnie na wykresie narysuj iloraz odleglosci intra/inter i wybierz (organoleptycznie) najlepsza liczbe klas''

chcesz wybrac liczbe klas,
najlatwiej zrobic wykres, gdzie dla roznej liczby klas rysujesz wartosc jakiegos kryterium
tutaj kryterium to iloraz odleglosci obiektow wewnatrz klas do odleglosci obiektow pomiedzy klasami

im wiecej klas tym ten iloraz bedzie mniejszy, najczesciej jednak nie potrzebuje sie bardzo wielu klas, dlatego z wkresu mozna ,,na oko'' wybrac liczbe klas ktora nie jest za duza a jednoczesnie gwarantuje ze badany iloraz jest juz przyzwoicie maly
_________________
pozdrawiam
Przemek
www.biecek.pl
 
     
luccassd 
Szeregowy


Posty: 3
Skąd: Warszawa
Wysłany: 2008-07-26, 19:23   

ok, dzięki tobie zrobiłem kolejny krok do przodu ale jeszcze nie wszystko jest dla mnie jasne :)

załóżmy że dzielę najpierw na dwie klasy - mam 1000 firm o obrocie do 100 tys i 1000 o obrocie powyżej. Odległość pomiędzy obiektami (firmami) liczę od ich zysku, tak? i jeżeli mam tam te 1000 sklepów w klasie to jak liczyć te odległości pomiędzy nimi? między każdym obiektem do innego? czy pomiędzy skrajnymi? i wtedy żeby porównać pomiędzy klasami to dla każdej klasy wyciągać średnią?

pisz do mnie "dużymi literami" bo nie bardzo czuję tą kwestię :)

dzięki za pomoc!!!
 
     
cogito 
Podporucznik



Pomógł: 30 razy
Posty: 310
Skąd: Wrocław
Wysłany: 2008-07-28, 18:44   

ten iloraz mozna liczyc roznie, mozna brac pod uwage skrajne obiekty jak zaproponowales
ale ja raczej uzylbym czegos na wzor ANOVA
czyli iloraz kwadratow odleglosci od srednich w grupach podzielic przez kwadraty odleglosci pomiedzy grupami

konkretniejsze wzory znajdziesz tutaj na stronie 28:
http://cran.r-project.org...Faraway-PRA.pdf

lub moze latwiej napisane tutaj:
http://mathworld.wolfram.com/ANOVA.html

po podstawieniu do wzoru wybralbym ten podzial gdzie F jest najmneijsze
_________________
pozdrawiam
Przemek
www.biecek.pl
 
     
mathkit 
Major



Pomógł: 46 razy
Wiek: 35
Posty: 1301
Skąd: Katowice
Wysłany: 2008-07-29, 15:37   

Zachęcam do przeczytania artykułu Statsoftu o analizie skupień. Jeżeli dysponujesz jakimś pakietem statystycznym to możesz uderzyć z grubej armaty.

Skupiłbym się głównie nad tematem "Przeglądanie wyników v-krotnego sprawdzianu krzyżowego" i skojarz to z tekstem Przemka, który mówił o wybraniu najlepszej ilości klas. Ponadto, możesz poczytać sobie jeszcze o wykresie osypiska.
 
 
     
krzysiud 
Szeregowy


Posty: 12
Skąd: Warszawa
Wysłany: 2011-04-10, 13:09   interpretacja wynikow analizy skupien

mam za zadanie stworzyć profile 30 osób ktore odpowiadały na na blok pytań, w wyniku czego powstalo 15 skal. Jakiej procedury mam użyc by to profilowanie otrzymać. W SPSS zrobilem analize skupień (metodą nabliższego sąsiedztwa) i klasyfikowanie metodą k-średnich (dwie grupy). Otrzymałem wyniki. Problem polega na tym, że w literaurze nie ma jasno powiedziane jak interpretować te wyniki. Wychodzi na to ze robi sie to na oko lub jak jeden z autorów powiedział "gdy cos tam cos tam sie wydluza pora odciac". Bede wdzieczny za podpowiedz. Pozdrawiam. :-)
_________________
krzysiud
 
     
Crunchy 
Major
Crunchy


Pomógł: 76 razy
Posty: 1135
Skąd: Katowice
Wysłany: 2011-04-11, 21:21   

No bo to jest kwestia interepretacji wymiarów, oceny co te skale tak naprawdę mierzą itp. Tu jest sporo miejsca na "radosną twórczość"...
 
     
krzysiud 
Szeregowy


Posty: 12
Skąd: Warszawa
Wysłany: 2011-04-12, 22:09   

to wiem ale dzieki chociaz za tyle
_________________
krzysiud
 
     
mathkit 
Major



Pomógł: 46 razy
Wiek: 35
Posty: 1301
Skąd: Katowice
Wysłany: 2011-04-12, 23:58   

Cytat:
Wychodzi na to ze robi sie to na oko lub jak jeden z autorów powiedział "gdy cos tam cos tam sie wydluza pora odciac"


Scaliłem Cię do odpowiedniego wątku, tutaj prawdopodobnie chodzi o wykres osypiska.
 
 
     
bel 
Szeregowy


Posty: 1
Skąd: Żory
Wysłany: 2014-04-27, 11:16   

Witam, chciałabym zrobić analizę skupień za pomocą SPSS Statistica.
Przebadałam 120 osób i chciałabym je podzielić metodą k-średnich na grupy uwzględniając 4 zmienne.
Chciałabym też określić procent osób w każdym skupieniu (czy program jakoś może pogrupować te osoby albo sam wyliczyć ten procent?)

Ja zrobiłam tak, że najpierw użyłam opcji "standaryzuj dane", bo zmienne mają różne skale, potem wybrałam opcje "wielowymiarowe"->"analiza skupień" ->"metoda k średnich" no i wybrałam, żeby program utworzył 4 skupienia (na podstawie doniesień naukowych odnośnie moich zmiennych).

Zastanawiam się jednak jak sprawdzić ile tak naprawdę powinno być skupień i czy to co wyrzuca program jest dobrze dopasowane do danych.
Zrobiłam analizę wariancji i wyszło mi, że w przypadku dwóch zmiennych wariancja wewnątrzgrupowa jest mniejsza niż zewnątrz grupowa, ale test F wskazywał na istotnośc statystyczną. Jakie inne wskaźniki należy uwzględnić?

Z kolei kiedy korzystam z opcji "data mining"->"segmentacja"->"algorytm k-średnich" i zaznaczam V-krotny sprawdzian krzyżowy (z zachowaniem domyślnych ustawień) program wyrzuca mi 3 skupienia.

Proszę o radę/instrukcję jak dokonać takiej analizy, z góry dziękuję :)
 
     
kaskaa 
Szeregowy


Wiek: 30
Posty: 1
Skąd: Kraków
Wysłany: 2015-03-14, 15:30   

Cześć, jestem na forum od niedawna :) Potrzebuję wykonać segmentację zbioru danych oraz predykcję dla szeregu czasowego. Czy znalazłby się ktoś na forum, kto sprawdziłby mi te projekty? Albo udzieliłby mi korepetycji przez skype?
 
     
Wyświetl posty z ostatnich:   
Odpowiedz do tematu
Nie możesz pisać nowych tematów
Nie możesz odpowiadać w tematach
Nie możesz zmieniać swoich postów
Nie możesz usuwać swoich postów
Nie możesz głosować w ankietach
Nie możesz załączać plików na tym forum
Możesz ściągać załączniki na tym forum
Dodaj temat do Ulubionych zakładek(IE)
Wersja do druku

Skocz do:  

Podobne Tematy
Temat Autor Forum Odpowiedzi Ostatni post
Brak nowych postów Przyklejony: Analiza skupień
Wybór obserwacji podobnych
slide23 Statystyka w badaniach sondażowych rynku 9 2016-10-12, 09:21
wwwmetodologpl
Brak nowych postów Przyklejony: [SPSS] Analiza skupień
ar.ek Data Mining, Metody klasyfikacji 15 2014-01-25, 14:27
interpretacja
Brak nowych postów Przyklejony: Analiza harmoniczna
przykład zadania
djdeaka Metody prognostyczne 3 2015-11-28, 01:11
vatran
Brak nowych postów Przyklejony: Analiza trendu
madzias Modelowanie ekonometryczne 7 2009-12-12, 14:30
Shidley
Brak nowych postów Przyklejony: Analiza dyskryminacji
interpretacja wyników
nzo Data Mining, Metody klasyfikacji 6 2012-10-28, 20:19
Abderyt

Ideą przyświecającą istnieniu forum statystycznego jest stworzenie możliwości wymiany informacji, poglądów i doświadczeń osób związanych ze statystyką, mierzenie się z różnego rodzaju problemami statystycznymi i aktuarialnymi. Poruszane problemy: Statystyka w badaniach sondażowych rynku, metody reprezentacyjne, Teoria i rachunek prawdopodobieństwa, statystyka opisowa, teoria estymacji, testowanie hipotez statystycznych, ekonometria, prognozowanie, metody data mining.
Copyright (C) 2006-2015 Statystycy.pl
Powered by phpBB modified by Przemo © 2003 phpBB Group
Strona wygenerowana w 0,19 sekundy. Zapytań do SQL: 25