Přehled o publikaci
2024
Srovnání kvality dat z „pravděpodobnostního“ a nepravděpodobnostního vzorku : Příklad českého výzkumu „GGP-Současná česká rodina“
KREIDL, Martin and Alžbeta ĽUDMOVÁBasic information
Original name
Srovnání kvality dat z „pravděpodobnostního“ a nepravděpodobnostního vzorku : Příklad českého výzkumu „GGP-Současná česká rodina“
Name (in English)
Comparing data quality in a probability and a non-probability sample : An investigation based on the GGP-contemporary Czech family project
Authors
KREIDL, Martin and Alžbeta ĽUDMOVÁ
Edition
13. podzimní sociologická konference, Olomouc 9. - 11. 10. 2024, 2024
Other information
Language
Czech
Type of outcome
Presentations at conferences
Country of publisher
Czech Republic
Confidentiality degree
is not subject to a state or trade secret
Organization
Fakulta sociálních studií – Repository – Repository
Keywords (in Czech)
kvalita data; dotazníkové šetření; pravděpodobnostní výběr; nepravděpodobnostní výběr; Generations and Gender Survey
Keywords in English
data quality; survey; probability sampling; non-probability sampling; Generations and Gender Survey
Links
LM2024074, research and development project.
Changed: 6/11/2024 00:51, RNDr. Daniel Jakubík
In the original language
Klasické metody sběru sociologických dat pomocí dotazníkových šetření z náhodně vybraných vzorků populace čelí čím dál větším obtížím, k nimž patří klesající návratnost, (potenciálně) klesající reprezentativita a rostoucí cena. Jedním ze způsobů, jak na tyto obtíže reagovat, je využívání dat z nepravděpodobnostních (opt-in) panelů. V tomto příspěvku na základě dat ze šetření „GGP-Současná česká rodina“ (z let 2020-2022) srovnáváme kvalitu dat získaných tradičním způsobem (pravděpodobnostní vzorek získaný náhodným výběrem adresních bodů a vytáčením náhodných mobilních telefonních čísel, N=5583) a dat získaných z pilotní studie stejného výzkumu, která se uskutečnila na opt-in panelu agentury SCaC (N=1313). Pomocí popisných statistik ukazujeme, že u řady proměnných mají proměnné stejnou distribuci a oba vzorky jsou nerozlišitelné. Podobně pomocí mnohorozměrných metod ukazujeme, že (při kontrole dalších proměnných) je efekt typu vzorku na závisle proměnnou často zanedbatelný. Pro řadu účelů lze vzorky efektivně spojovat. Před každou analýzou je však třeba konkrétní proměnné pečlivě prozkoumat a efekt vzorku vyloučit. Pro budoucí výzkum je vždy vhodné počítat i s možností sběru dat v opt-in nepravděpodobnostních panelech.
In English
Traditional methods of collecting sociological data using questionnaire surveys from random samples of the population face increasing difficulties, including diminishing returns, (potentially) declining representativeness, and increasing cost. One way to address these difficulties is to use data from non-probability (opt-in) panels. In this paper, using data from the GGP-Contemporary Czech Family Survey (from 2020-2022), we compare the quality of data obtained in the traditional way (a probability sample obtained by randomly selecting address points and dialing random mobile phone numbers, N=5583) and data obtained from a pilot study of the same survey conducted on an opt-in panel of the SCaC agency (N=1313). Using descriptive statistics, we show that for a number of variables, the variables have the same distribution and the two samples are indistinguishable. Similarly, using multivariate methods, we show that (controlling for other variables) the effect of sample type on the dependent variable is often negligible. For many purposes, samples can be effectively pooled. However, before any analysis, the specific variables need to be carefully examined to rule out sample effects. For future research, it is always advisable to include the possibility of collecting data in opt-in non-probability panels.