To jest tylko wersja do druku, aby zobaczyć pełną wersję tematu, kliknij TUTAJ
Statystyka, prognozowanie, ekonometria, data mining
Forum miłośników statystyki - Portal Statystyczny

Wiedza statystyczna - Zmienna ilościowa a nominalna

adhoc1 - 2018-04-15, 10:44
Temat postu: Zmienna ilościowa a nominalna
Dzień dobry,
Chciałabym zbadać korelacje pomiędzy zmienna ilościowa, a nominalna (odpowiedzi tak, nie - zakodowane 1-tak, 2-nie)
Jak powinnam to zrobic, jaki test będzie odpowiedni?
Szukalam odpowiedzi, ale nigdzie nie znalazłam.

Mam 116 przypadków. Korelacja jest pomiędzy atrakcyjnością fizyczna (oceniano w skali 1-10) do pytania wielokrotnego wyboru Nie podejmuję aktywności fizycznej, gdzie odpowiedzi to 1-tak, 2-nie.
Chciałabym sprawdzić czy osoby, które podejmuja aktywność fizyczna maja wyzsza samoocene. Nawet jeśli korelacja wychodzi dodatnia, nie wiem jaki wniosek wyciągnąć. Im wyzsza ocena atrakcyjności, tym większa aktywność czy mniejsza?

szw1710 - 2018-04-15, 14:46

Zmienna tak / nie nie jest w skali porządkowej, więc odpadają rangi Spearmana. Zrób zwyczajny test chi-kwadrat niezależności.
adhoc1 - 2018-04-15, 15:53

Dobrze, jesli w tym tescie Pearsona (bo tak się nazywa test niezależności chi-kwadrat) wyszlo 0,2
To jak moge interpretować te korelacje? Im wyzsza ocena atrakcyjności tym większa czy mniejsza aktywność fizyczna?

szw1710 - 2018-04-15, 19:34

A co wyszło 0.2? Pokaż wydruk.
adhoc1 - 2018-04-15, 21:38

Niestety nie jestem w stanie załączyć zdjęcia.
Robiąc wykres rozrzutu odczytuję r=0,24 p=0,01

Posługuję się Statisticą, nie do końca wiem chyba co mam zrobić i na jakiej podstawie odczytać zależność. Czy test chi kwadrat niezależności to współczynnik Pearsona?

Czy mogę jakoś podzielić odpowiedzi dotyczące aktywności fizycznej (czy podejmuje) na TAK/NIE i dać je jako zmienną grupującą, a oceny atrakcyjności jako zmienną zależną?
Grupą, którą ankietowałam były kobiety.

Nie wiem jak się do tego pytania zabrać kompletnie :-(

szw1710 - 2018-04-16, 07:14

p=0.01 to zapewne tzw. p-wartość czyli krytyczny poziom istotności. Mianowicie dla poziomów istotności poniżej p-wartości czyli 1%, brak podstaw do odrzucenia hipotezy zerowej o niezależności cech. Natomiast dla wyższych poziomów istotności odrzucamy hipotezę o niezależności.

Wyszłoby więc na to, że poziom samooceny zależy od podejmowania aktywności fizycznej.

Osobiście jednak chciałbym zobaczyć te dane. Podlinkuj tu arkusz z nimi albo je zwyczajnie wpisz. To wystarczy, bo i tak większość z nas posługuje się R.

adhoc1 - 2018-04-16, 09:50

Dodam jeszcze, że dane dotyczą kobiet w trakcie ciąży, które ocenialy swoja atrakcyjność i to, czy w czasie jej trwania uprawiają aktywność fizyczną.


W tabeli wygląda to tak:
W pierwszej kolumnie jest ocena atrakcyjności
W drugiej Ilość odpowiedzi na TAK (dotyczące Nie podejmuję aktywności fizycznej)
W trzeciej kolumnie odpowiedzi na NIE (czyli Podejmuję aktywność fizyczną)


1. 2 4
2. 4 6
3. 1 8
4. 0 9
5. 2 16
6. 2 12
7. 1 10
8. 1 21
9. 1 9
10. 0 7
Ogół 14 102

Czy taki zapisane dane wystarczą?

Przesyłam jeszcze dane w kolumnach:
Atrakcyjność od 1-10
1 7
2 10
3 7
4 8
5 4
6 8
7 5
8 8
9 5
10 8
11 8
12 8
13 4
14 6
15 6
16 8
17 2
18 1
19 6
20 5
21 9
22 6
23 1
24 4
25 7
26 5
27 3
28 5
29 2
30 5
31 6
32 9
33 5
34 3
35 9
36 6
37 7
38 5
39 8
40 4
41 7
42 8
43 4
44 10
45 3
46 2
47 9
48 7
49 5
50 6
51 8
52 10
53 10
54 4
55 5
56 9
57 8
58 6
59 7
60 8
61 7
62 9
63 8
64 8
65 3
66 1
67 8
68 2
69 9
70 5
71 10
72 7
73 6
74 5
75 5
76 2
77 6
78 2
79 4
80 9
81 2
82 4
83 6
84 10
85 3
86 8
87 3
88 1
89 8
90 1
91 2
92 6
93 6
94 4
95 2
96 7
97 6
98 9
99 5
100 8
101 5
102 5
103 2
104 8
105 5
106 3
107 8
108 1
109 8
110 3
111 9
112 5
113 10
114 7
115 3
116 8

Nie podejmuję aktywności fizycznej
1 Nie
2 Nie
3 Nie
4 Nie
5 Nie
6 Nie
7 Nie
8 Nie
9 Nie
10 Nie
11 Nie
12 Nie
13 Nie
14 Nie
15 Nie
16 Nie
17 Nie
18 Tak
19 Tak
20 Tak
21 Tak
22 Nie
23 Nie
24 Nie
25 Nie
26 Nie
27 Nie
28 Nie
29 Nie
30 Nie
31 Nie
32 Nie
33 Nie
34 Nie
35 Nie
36 Tak
37 Nie
38 Nie
39 Nie
40 Nie
41 Nie
42 Nie
43 Nie
44 Nie
45 Nie
46 Tak
47 Nie
48 Tak
49 Nie
50 Nie
51 Nie
52 Nie
53 Nie
54 Nie
55 Nie
56 Nie
57 Nie
58 Nie
59 Nie
60 Nie
61 Nie
62 Nie
63 Nie
64 Nie
65 Nie
66 Nie
67 Nie
68 Tak
69 Nie
70 Nie
71 Nie
72 Nie
73 Nie
74 Nie
75 Tak
76 Tak
77 Nie
78 Tak
79 Nie
80 Nie
81 Nie
82 Nie
83 Nie
84 Nie
85 Nie
86 Nie
87 Nie
88 Nie
89 Nie
90 Nie
91 Nie
92 Nie
93 Nie
94 Nie
95 Nie
96 Nie
97 Nie
98 Nie
99 Nie
100 Nie
101 Nie
102 Nie
103 Nie
104 Nie
105 Nie
106 Tak
107 Tak
108 Tak
109 Nie
110 Nie
111 Nie
112 Nie
113 Nie
114 Nie
115 Nie
116 Nie

szw1710 - 2018-04-16, 14:22

Tak, te dane zupełnie wystarczą, nawet sama tabelka była dobra. Oto obiecane sprawdzenie w R.

Kod:

> dane<-matrix(nrow=10,ncol=2,c(2,4,1,0,2,2,1,1,1,0,4,6,8,9,16,12,10,21,9,7))
> dane
      [,1] [,2]
 [1,]    2    4
 [2,]    4    6
 [3,]    1    8
 [4,]    0    9
 [5,]    2   16
 [6,]    2   12
 [7,]    1   10
 [8,]    1   21
 [9,]    1    9
[10,]    0    7
> chisq.test(dane)

    Pearson's Chi-squared test

data:  dane
X-squared = 13.498, df = 9, p-value = 0.1413

Komunikat ostrzegawczy:
W poleceniu 'chisq.test(dane)': Aproksymacja chi-kwadrat może być niepoprawna
> chisq.test(dane,simulate.p.value= TRUE, B= 10000)

    Pearson's Chi-squared test with simulated p-value (based on 10000 replicates)

data:  dane
X-squared = 13.498, df = NA, p-value = 0.1364



Zrobiłem dwa testy w związku z tą niepoprawną aproksymacją. Widzimy, że p-wartość wychodzi podobna. Za każdym uruchomieniem drugiego testu wychodzi nieco inaczej, gdyż tam używa się metody Monte Carlo.

Nie odpowiadam za użycie Statistica, gdyż nie znam tego programu. Wiem co zrobiłem w R. p-wartość wychodzi ok. 13% - 14%, więc dla poziomów istotności poniżej p-wartości (a sensowne są te do 10%) brak jest podstaw do odrzucenia hipotezy o niezależności oceny atrakcyjności od uprawiania aktywności fizycznej.

W poprzednim swoim poście błędnie odczytałem to co napisałaś jako 0.1 a było 0.01 (chyba że w międzyczasie poprawiłaś). Odpowiednio zmieniłem tam komentarz.

adhoc1 - 2018-04-16, 14:42

Dziekuję za wszystkie odpowiedzi. Jednak nie
wiem nadal jakiego testu statystycznego powinnam użyć? Czy wystarczy macierz korelacji?

Mam rozumiec, ze korelacja między tymi zmiennymi jest istotna (bo p=0,01) jednak bardzo niewielka?

szw1710 - 2018-04-16, 16:42

Trudno mówić tu o korelacji, skoro jedna zmienna jest jakościowa. Bardzo mała liczba odpowiedzi TAK świadczy o tym, że jednak niezależnie czy ciężarna uprawia aktywność, czy też nie, postrzega siebie albo dobrze, albo źle, więc zgadza się to z wynikiem testu chi-kwadrat niezależności cech, który przeprowadziłem.


Powered by phpBB modified by Przemo © 2003 phpBB Group