Statystyka, prognozowanie, ekonometria, data mining Strona Główna
Reklama pqstat.pl
Statystyka, prognozowanie, ekonometria, data mining
Forum miłośników statystyki - Portal Statystyczny

FAQFAQ  SzukajSzukaj  UżytkownicyUżytkownicy  GrupyGrupy  StatystykiStatystyki
RejestracjaRejestracja  ZalogujZaloguj  Chat   Regulamin  Kadra forum
PORTAL STATYSTYCZNY
 Ogłoszenie 
FORUM STATYSTYCZNE MA JUŻ 10 LAT

Znasz statystykę lub ekonometrię, metody prognozowania, data mining i chcesz pomóc w rozwoju forum statystycznego ?
Pisz na: administrator(małpa)statystycy.pl

Rozpoczął swoją działalność portal statystyczny - masz pomysł na jego rozwój ?

Drogi forumowiczu! Zanim napiszesz posta zapoznaj się z regulaminem forum i przedstaw się
The International Year of Statistics (Statistics2013) Free statistics help forum. Discuss statistical research, statistical consulting Smarter Poland Portal statystyczny

Poprzedni temat «» Następny temat

Tagi tematu: Brak tagów.

Dobór próby - pomoc <laik>
Autor Wiadomość
TomekS 
Szeregowy


Posty: 5
Skąd: Toruń
Wysłany: 2012-08-07, 14:52   Dobór próby - pomoc <laik>

Przeprowadziłem badania ankietowe wśród nauczycieli przedmiotu "x" w gimnazjum pewnego województwa. Pytania dotyczyły stosowanych metod pracy nauczycieli podczas lekcji, które zależą również w pewnym stopniu od wyposażenia szkoły.

Nie mogłem dotrzeć do listy wszystkich nauczycieli przedmiotu "x"w województwie. Spośród wszystkich szkół gimnazjalnych w województwie wybrałem te, które są najbardziej reprezentatywne (nie brałem pod uwagę szkół dla dorosłych i szkół specjalnych). Wysłałem ankiety do wszystkich szkół gimnazjalnych publicznych i niepublicznych w województwie. Otrzymałem ankiety od 30% szkół.

Zacząłem się zastanawiać czy mój dobór próby jest prawidłowy. Jak fachowo nazwać taki dobór próby?

[ Dodano: 2012-08-07, 14:53 ]
Tom,
 
     
Google

Wysłany:    Reklama google.

 
 
Pralina 
Starszy Szeregowy


Pomogła: 2 razy
Posty: 11
Skąd: Warszawa
Wysłany: 2012-08-07, 20:06   

Moim zdaniem istnieje duże prawdopodobieństwo, że otrzymane wyniki ankiet będą obciążone. Jest to związane z tzw. problemem selekcji próby - szkoły, które zdecydowały się na odpowiedź mogą wykorzystywać zupełnie inne techniki nauczania niż te, które odpowiedzi nie udzieliły. Chcę przez to powiedzieć, że chęć uzupełnienia ankiety może być silnie skorelowana z metodami pracy. Dużo lepszym rozwiązaniem byłoby losowe wybranie szkół, do których skierowane zostałyby ankiety i "dopilnowanie" otrzymania odpowiedzi od wszystkich z nich (albo przynajmniej "prawie wszystkich":)).
 
     
TomekS 
Szeregowy


Posty: 5
Skąd: Toruń
Wysłany: 2012-08-07, 20:29   

Ankieta miała na celu zebranie informacji na temat stopnia i sposobów wykorzystywania komputera podczas lekcji. Bardziej chodziło o uzyskanie informacji jakościowych niż ilościowych. Pytania były skonstruowane w taki sposób aby mogli się wypowiedzieć zarówno Ci co wykorzystują komputery oraz Ci co go nie stosują (wtedy ankietowany został skierowany do następnej części ankiety i pytano go o przyczyny niewykorzystywania).
 
     
Pralina 
Starszy Szeregowy


Pomogła: 2 razy
Posty: 11
Skąd: Warszawa
Wysłany: 2012-08-07, 21:29   

Charakter analizowanych danych (jakościowe/ilościowe) niestety nic nie zmienia. W każdym z przypadków próba musi być losowa, aby wyciągać wnioski na populację, a bazowanie na danych uzyskanych w przedstawiony przez Ciebie sposób nie musi ale może zaburzyć wyniki.
Rozumiem, że został już włożony ogrom pracy w uzyskanie ankiet do analiz, ale to co do tej pory zrobiłeś wciąż może być efektywnie wykorzystane. To co ja bym zrobiła na Twoim miejscu:
(1) Wybrała losowo szkoły z grupy jednostek, które nie udzieliły odpowiedzi i mimo trudności postarała się uzyskać odpowiedzi
(2) Sprawdziła czy uzyskane w pkt (1) dane są porównywalne z tymi, które zostały uzyskane w grupie szkół, które bez problemu udzieliły odpowiedzi
(3) Jeśli pkt. (2) da pozytywne wyniki wówczas można założyć, że 30% próba pobrana na początku jest reprezentatywna, poszerzyć ja o nowe dane i szaleć z nimi do woli:)
(4) Jeśli jednak okaże się, że rozkłady są istotnie różne to wówczas będzie to oznaką obciążenia pierwotnej próby i wyniki trzeba będzie odpowiednio przeważyć, aby uzyskać reprezentację populacji.

Oczywiście możesz pozostać przy już posiadanych danych, ale jednocześnie mieć świadomość możliwości popełnienia błędu. Polecam przyjrzeć się historii czasopisma "Literary Digest", które w roku 1936 przeprowadziło sondaż przedwyborczy. Wysłano ankiety do 10 mln osób, odpowiedziało 25% z nich. Na takich danych oparto badania. Jak się później okazało wyniki zupełnie rozminęły się z rzeczywistością. Przyczyn niepowodzenia było kilka, ale jednym z nich okazało się właśnie bazowanie na otrzymanych 25%, które nie przedstawiły w sposób reprezentatywny całej populacji.
 
     
Maro 
Podporucznik


Pomógł: 11 razy
Posty: 346
Skąd: Warszawa
Wysłany: 2012-08-07, 23:11   

Aby w pełni ocenić wartość próby jaką zebrałeś, pokusiłbym się jeszcze o zebranie informacji na temat struktury badanej populacji. Poszukałbym informacji o tym jak w populacji szkół gimnazjalnych w danym województwie rozkładała się np. wielkość tych szkół, ile z nich przypadało na stolicę województwa, ile na miasta o różnych wielkościach itp. Gdy będziesz miał te dane zestaw je z rozkładami tych cech w próbie i sprawdź jak bardzo podobną do populacji próbę udało Ci sie uzyskać.

Jeśli dobrze rozumiem, chciałeś zrealizować badanie pełne (wysłałeś kwestionariusze do wszystkich elementów populacji) ale otrzymałeś odpowiedź od 30% (czyli miałeś 70% braków odpowiedzi, tzw. nonresponse).

Badanie pełne lub losowy dobór próby (o odpowiedniej wielkości i najlepiej warstowwej) ze 100% response'm zapewniłby wysoką reprezentatywność tej próby, ale nie miałeś 100% response'u oraz nie masz podstaw by twierdzić, że 30% populacji odpowiedziało w sposób losowy. Sprawdź więc, czy znajdujesz systematyczne różnice pomiędzy twoją próbą a populacją w zakresie cech jakie przyjdą Ci do głowy (przy założeniu, że zmienne te wpływają na mierzone zjawisko).

Dyskusję na temat tego jaki poziom nonresponse sprawia że nie można stosować metod wnioskowania statystycznego oraz tego czym jest reprezentatywność i czy da się ją osiągnąć w badaniach społecznych zostawiłbym na moment w którym będziesz już wiedział, na ile Twoja próba jest dobrą "miniaturą" populacji, bo o to przecież chodzi w reprezentatywności ;-)
 
     
TomekS 
Szeregowy


Posty: 5
Skąd: Toruń
Wysłany: 2012-08-07, 23:52   

Dzięki wielkie za pomoc. Jeszcze raz muszę to wszystko przetrawić ale już powoli łapię :-P

[ Dodano: 2012-08-09, 11:34 ]
Przeanalizowałem zebrane dane i porównałem populację z próbą.

Wielkość miejscowości
....................................................[Populacja (315)]........[Próba (103)].........[Różnica]
miasto do 5 tys. mieszkańców..............[6%].........................[11%]...............[+5%]
miasto pow. 5 tys. mieszkańców..........[42%]........................[45%]...............[+3%]
wieś..................................................[52%]........................[45%]................[-7%]


Złożoność.....................................[Populacja (315)]...........[Próba(103)].........[Różnica]
samodzielne gimnazjum.......................[43%]........................[44%]................[+1%]
gimnazjum w zespole szkół .................[57%]........................[56%]................[-1%]

Czy to wystarczy żeby uznać czy moja próba jest reprezentatywna?
Ostatnio zmieniony przez TomekS 2012-08-10, 14:05, w całości zmieniany 1 raz  
 
     
Maro 
Podporucznik


Pomógł: 11 razy
Posty: 346
Skąd: Warszawa
Wysłany: 2012-08-09, 21:08   

Czy to są wszystkie informacje jakie mogłeś/możesz zebrać na temat populacji i próby? Co z wielkością tych szkół (liczba uczniów, liczba oddziałów)?
 
     
TomekS 
Szeregowy


Posty: 5
Skąd: Toruń
Wysłany: 2012-08-10, 14:13   

Posiadając liczbę uczniów w każdej szkole i liczbę oddziałów przeliczyłem jaka jest średnia liczba uczniów w klasie. Niestety dane dotyczące liczby nauczycieli są niepełne.

Liczba uczniów w klasie
....................................................[Populacja (315)]........[Próba (103)].........[Różnica]
do 20 osób............................................[27%].......................[26%]...............[-1%]
21-25 osób...........................................[54%]........................[53%]...............[-1%]
pow. 26 osób........................................[19%]........................[20%]...............[+1%]

:-P
 
     
Maro 
Podporucznik


Pomógł: 11 razy
Posty: 346
Skąd: Warszawa
Wysłany: 2012-08-13, 08:59   

Pokaż jeszcze dane dla liczby uczniów i oddziałów osobno (bez wyliczania wskaźnika średniej liczby uczniów w klasie). Przyjrzałbym się też nieco dokładniej rozkładowi ze wzgledu na wielkość miejscowości (więcej przedziałów dla miast). Zakładam w ogóle, że najpierw oglądasz rozkłady szczegółowe, a dopiero potem kategoryzujesz je i tworzysz przedziały?

Generalnie wygląda to bardzo dobrze. Dużo lepiej niż się spodziewałem ;-)

Jakie wg Ciebie jeszcze zmienne, mogą być związane ze zmienną/zmiennymi badanymi przez Ciebie?
 
     
TomekS 
Szeregowy


Posty: 5
Skąd: Toruń
Wysłany: 2012-08-13, 14:06   

Moje dalsze porównania wyglądają następująco: :-P

Wielkość miejscowości
....................................................[Populacja (315)]........[Próba (103)].........[Różnica]
miasto do 5 tys. mieszkańców................[6%]......................[11%]..................[+5%]
miasto 5-50 tys. mieszkańców................[13%]....................[17%]..................[+4%]
miasto 50-100 tys. mieszkańców.............[5%].....................[4%]....................[-1%]
miasto 100-200 tys. mieszkańców...........[4%].....................[2%]....................[-2%]
powyżej 200 tys. mieszkańców...............[20%]....................[21%]..................[+1%]
wieś.....................................................[52%]....................[45%]..................[-7%]


Liczba oddziałów w szkole
....................................................[Populacja (315)]........[Próba (103)].........[Różnica]
1-10.....................................................[70%]......................[65%]..................[-5%]
11-20...................................................[26%]......................[29%]..................[+3%]
powyżej 21...........................................[4%].........................[6%]...................[+2%]


Liczba uczniów w szkole
....................................................[Populacja (315)]........[Próba (103)].........[Różnica]
poniżej 100...........................................[20%]......................[16%]..................[-4%]
101-200................................................[40%]......................[41%]..................[+1%]
201-300................................................[22%]......................[26%]..................[+4%]
301-500................................................[14%]......................[14%]..................[0%]
powyżej 501..........................................[5%]........................[5%]...................[0%]

Wydaje mi się, że to na razie wszystkie zmienne, które mogłyby wpłynąć na sposoby wykorzystania komputera i multimediów w nauczaniu w gimnazjum. Właściwie najważniejsze z nich to średnia liczba uczniów w klasie i wielkość miejscowości (czy to jest duże miasto czy wieś).
Teraz jak patrzę na te porównania i sposób w jaki przeprowadziłem badanie to chyba miałem dużo szczęścia... :-P :mrgreen:

Czy teraz mogę uznać, że moja próba jest reprezentatywna czy mam kombinować jeszcze dalej? ; ;-)
 
     
Maro 
Podporucznik


Pomógł: 11 razy
Posty: 346
Skąd: Warszawa
Wysłany: 2012-08-13, 15:18   

Teraz kiedy znamy lepiej rozkłady niektórych zmiennych (które jak twierdzisz mogą być związane z badaną zmienną) i widzimy, że rozkłady te w populacji i próbie są podobne, możemy wynikami z próby zajmować się dalej :-)

Bardzo ważne jest, abyś-próbując rozstrzygnąć o poziomie reprezentatywności swojej próby-jak najdokładniej sprecyzował, czym ta reprezentatywność jest i jaki jej poziom jest Ci potrzebny. Skoro drążysz temat metod doboru próby, prawdopodobnie zorientowałeś się, że:

Cytat:
Termin "próba reprezentatywna" nie istnieje w statystyce matematycznej. Jeśli jednak ktoś biegły w statystyce mówi o próbie reprezentatywnej, zazwyczaj ma na myśli próbę dobraną w taki sposób, że sam sposób doboru próby nie prowadzi do powstania błędu systematycznego (kierunkowego wypaczenia wyników).


Cytat pochodzi z tego artykułu. Gdy już zapoznasz się z tym artykułem, i nadal będziesz miał problem z tym jakie działania na tej próbie możesz podjąć, pisz śmiało.

Do dalszych celów analitycznych (nieważne czy zakładających korzystanie z reguł wnioskowania statystycznego czy nie), powinieneś również zapoznać się z ideą ważenia wyników z próby. Jeśli zdecydujesz, że możesz ze swoją próbą nadal pracować, należałoby przeważyć te wyniki wagami populacyjnymi (które znasz).

Powodzenia :-)
 
     
tomasz.rak 
Szeregowy
tomasz.rak


Wiek: 27
Posty: 1
Skąd: Kraków
Wysłany: 2012-09-11, 14:25   

witam mam problem z pewnym zadaniem mógłbym prosić o pomoc????
 
     
Shidley 
Podpułkownik
Shidley



Pomógł: 122 razy
Wiek: 46
Posty: 2348
Skąd: Gdańsk
Wysłany: 2012-09-11, 14:35   

umieść pytanie na forum, być może ktoś Ci coś podpowie
_________________
Każdy ma to na co zasłużył...
 
     
Wyświetl posty z ostatnich:   
Odpowiedz do tematu
Nie możesz pisać nowych tematów
Nie możesz odpowiadać w tematach
Nie możesz zmieniać swoich postów
Nie możesz usuwać swoich postów
Nie możesz głosować w ankietach
Nie możesz załączać plików na tym forum
Możesz ściągać załączniki na tym forum
Dodaj temat do Ulubionych zakładek(IE)
Wersja do druku

Skocz do:  

Podobne Tematy
Temat Autor Forum Odpowiedzi Ostatni post
Brak nowych postów Przyklejony: dobór próby
kubson Metody reprezentacyjne 12 2017-01-17, 12:13
Dawid Opolski
Brak nowych postów Przyklejony: dobór losowy w praktyce
Marzi Metody reprezentacyjne 8 2010-01-21, 20:31
Crunchy
Brak nowych postów Przyklejony: Dobór wyczerpujący i udziałowy
myszasta1 Metody reprezentacyjne 2 2009-06-07, 13:33
myszasta1
Brak nowych postów Przyklejony: Dobór trendu, rodzaj wykresu
k0tus Metody prognostyczne 34 2011-05-27, 17:42
anecik162
Brak nowych postów Przyklejony: Dobór meotdy do wyznaczenia trendu
swm2 Metody prognostyczne 7 2015-06-11, 00:14
mathkit

Ideą przyświecającą istnieniu forum statystycznego jest stworzenie możliwości wymiany informacji, poglądów i doświadczeń osób związanych ze statystyką, mierzenie się z różnego rodzaju problemami statystycznymi i aktuarialnymi. Poruszane problemy: Statystyka w badaniach sondażowych rynku, metody reprezentacyjne, Teoria i rachunek prawdopodobieństwa, statystyka opisowa, teoria estymacji, testowanie hipotez statystycznych, ekonometria, prognozowanie, metody data mining.
Copyright (C) 2006-2015 Statystycy.pl
Powered by phpBB modified by Przemo © 2003 phpBB Group
Strona wygenerowana w 0,1 sekundy. Zapytań do SQL: 24