To jest tylko wersja do druku, aby zobaczyć pełną wersję tematu, kliknij TUTAJ
Statystyka, prognozowanie, ekonometria, data mining
Forum miłośników statystyki - Portal Statystyczny

Data Mining, Metody klasyfikacji - Clustering Ward - zrozumienie wyników (drzewko numeryczne)

matdob - 2018-07-12, 14:03
Temat postu: Clustering Ward - zrozumienie wyników (drzewko numeryczne)
Dzień dobry,

Czy możecie mi pomóc w zrozumieniu wyników? Potrzebowałem 381 punktów danych pogrupować do 30 klas. Posłużyłem się w tym celu narzędziem online dostępnym tutaj .

Wyniki mają postać:
Summary of Dendrogram,
Label,Height,
1,6.00000000017253e-07,
2,6.70000000002613e-06,
3,6.99999999997925e-06,
...
376,1.13866747967952,
377,2.90518306559885,
378,3.3870470650095,
379,5.21329147994801,
380,11.5943640981408,

Jeśli dobrze rozumiem, to powyższa lista przedstawia schemat łączenia punktów w klastry, gdzie pierwszy wiersz to pierwsze łączenie a 380-ty ostatnie. Height to jakaś miara błędu/odległości. Zgaduję, że aby osiągnąć mój cel (30 klas) - muszę jakoś odwołać się do wierszy od 1 do 350, bo gdzieś tam w okolicach 350-tego mam już 30 klastrów. Pytanie zasadnicze: skąd mam wiedzieć które punkty danych zostały połączone z którymi?

Pozdrawiam
Mateusz



Powered by phpBB modified by Przemo © 2003 phpBB Group