k 2024

Srovnání kvality dat z „pravděpodobnostního“ a nepravděpodobnostního vzorku : Příklad českého výzkumu „GGP-Současná česká rodina“

KREIDL, Martin and Alžbeta ĽUDMOVÁ

Basic information

Original name

Srovnání kvality dat z „pravděpodobnostního“ a nepravděpodobnostního vzorku : Příklad českého výzkumu „GGP-Současná česká rodina“

Name (in English)

Comparing data quality in a probability and a non-probability sample : An investigation based on the GGP-contemporary Czech family project

Authors

KREIDL, Martin and Alžbeta ĽUDMOVÁ

Edition

13. podzimní sociologická konference, Olomouc 9. - 11. 10. 2024, 2024

Other information

Language

Czech

Type of outcome

Presentations at conferences

Country of publisher

Czech Republic

Confidentiality degree

is not subject to a state or trade secret

Organization

Fakulta sociálních studií – Repository – Repository

Keywords (in Czech)

kvalita data; dotazníkové šetření; pravděpodobnostní výběr; nepravděpodobnostní výběr; Generations and Gender Survey

Keywords in English

data quality; survey; probability sampling; non-probability sampling; Generations and Gender Survey

Links

LM2024074, research and development project.
Changed: 6/11/2024 00:51, RNDr. Daniel Jakubík

Abstract

In the original language

Klasické metody sběru sociologických dat pomocí dotazníkových šetření z náhodně vybraných vzorků populace čelí čím dál větším obtížím, k nimž patří klesající návratnost, (potenciálně) klesající reprezentativita a rostoucí cena. Jedním ze způsobů, jak na tyto obtíže reagovat, je využívání dat z nepravděpodobnostních (opt-in) panelů. V tomto příspěvku na základě dat ze šetření „GGP-Současná česká rodina“ (z let 2020-2022) srovnáváme kvalitu dat získaných tradičním způsobem (pravděpodobnostní vzorek získaný náhodným výběrem adresních bodů a vytáčením náhodných mobilních telefonních čísel, N=5583) a dat získaných z pilotní studie stejného výzkumu, která se uskutečnila na opt-in panelu agentury SCaC (N=1313). Pomocí popisných statistik ukazujeme, že u řady proměnných mají proměnné stejnou distribuci a oba vzorky jsou nerozlišitelné. Podobně pomocí mnohorozměrných metod ukazujeme, že (při kontrole dalších proměnných) je efekt typu vzorku na závisle proměnnou často zanedbatelný. Pro řadu účelů lze vzorky efektivně spojovat. Před každou analýzou je však třeba konkrétní proměnné pečlivě prozkoumat a efekt vzorku vyloučit. Pro budoucí výzkum je vždy vhodné počítat i s možností sběru dat v opt-in nepravděpodobnostních panelech.

In English

Traditional methods of collecting sociological data using questionnaire surveys from random samples of the population face increasing difficulties, including diminishing returns, (potentially) declining representativeness, and increasing cost. One way to address these difficulties is to use data from non-probability (opt-in) panels. In this paper, using data from the GGP-Contemporary Czech Family Survey (from 2020-2022), we compare the quality of data obtained in the traditional way (a probability sample obtained by randomly selecting address points and dialing random mobile phone numbers, N=5583) and data obtained from a pilot study of the same survey conducted on an opt-in panel of the SCaC agency (N=1313). Using descriptive statistics, we show that for a number of variables, the variables have the same distribution and the two samples are indistinguishable. Similarly, using multivariate methods, we show that (controlling for other variables) the effect of sample type on the dependent variable is often negligible. For many purposes, samples can be effectively pooled. However, before any analysis, the specific variables need to be carefully examined to rule out sample effects. For future research, it is always advisable to include the possibility of collecting data in opt-in non-probability panels.

Files attached