k 2024

Srovnání kvality dat z „pravděpodobnostního“ a nepravděpodobnostního vzorku : Příklad českého výzkumu „GGP-Současná česká rodina“

KREIDL, Martin a Alžbeta ĽUDMOVÁ

Základní údaje

Originální název

Srovnání kvality dat z „pravděpodobnostního“ a nepravděpodobnostního vzorku : Příklad českého výzkumu „GGP-Současná česká rodina“

Název anglicky

Comparing data quality in a probability and a non-probability sample : An investigation based on the GGP-contemporary Czech family project

Autoři

KREIDL, Martin a Alžbeta ĽUDMOVÁ

Vydání

13. podzimní sociologická konference, Olomouc 9. - 11. 10. 2024, 2024

Další údaje

Jazyk

čeština

Typ výsledku

Prezentace na konferencích

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Organizace

Fakulta sociálních studií – Masarykova univerzita – Repozitář

Klíčová slova česky

kvalita data; dotazníkové šetření; pravděpodobnostní výběr; nepravděpodobnostní výběr; Generations and Gender Survey

Klíčová slova anglicky

data quality; survey; probability sampling; non-probability sampling; Generations and Gender Survey

Návaznosti

LM2024074, projekt VaV.
Změněno: 6. 11. 2024 00:51, RNDr. Daniel Jakubík

Anotace

ORIG EN

V originále

Klasické metody sběru sociologických dat pomocí dotazníkových šetření z náhodně vybraných vzorků populace čelí čím dál větším obtížím, k nimž patří klesající návratnost, (potenciálně) klesající reprezentativita a rostoucí cena. Jedním ze způsobů, jak na tyto obtíže reagovat, je využívání dat z nepravděpodobnostních (opt-in) panelů. V tomto příspěvku na základě dat ze šetření „GGP-Současná česká rodina“ (z let 2020-2022) srovnáváme kvalitu dat získaných tradičním způsobem (pravděpodobnostní vzorek získaný náhodným výběrem adresních bodů a vytáčením náhodných mobilních telefonních čísel, N=5583) a dat získaných z pilotní studie stejného výzkumu, která se uskutečnila na opt-in panelu agentury SCaC (N=1313). Pomocí popisných statistik ukazujeme, že u řady proměnných mají proměnné stejnou distribuci a oba vzorky jsou nerozlišitelné. Podobně pomocí mnohorozměrných metod ukazujeme, že (při kontrole dalších proměnných) je efekt typu vzorku na závisle proměnnou často zanedbatelný. Pro řadu účelů lze vzorky efektivně spojovat. Před každou analýzou je však třeba konkrétní proměnné pečlivě prozkoumat a efekt vzorku vyloučit. Pro budoucí výzkum je vždy vhodné počítat i s možností sběru dat v opt-in nepravděpodobnostních panelech.

Anglicky

Traditional methods of collecting sociological data using questionnaire surveys from random samples of the population face increasing difficulties, including diminishing returns, (potentially) declining representativeness, and increasing cost. One way to address these difficulties is to use data from non-probability (opt-in) panels. In this paper, using data from the GGP-Contemporary Czech Family Survey (from 2020-2022), we compare the quality of data obtained in the traditional way (a probability sample obtained by randomly selecting address points and dialing random mobile phone numbers, N=5583) and data obtained from a pilot study of the same survey conducted on an opt-in panel of the SCaC agency (N=1313). Using descriptive statistics, we show that for a number of variables, the variables have the same distribution and the two samples are indistinguishable. Similarly, using multivariate methods, we show that (controlling for other variables) the effect of sample type on the dependent variable is often negligible. For many purposes, samples can be effectively pooled. However, before any analysis, the specific variables need to be carefully examined to rule out sample effects. For future research, it is always advisable to include the possibility of collecting data in opt-in non-probability panels.
Zobrazeno: 15. 9. 2025 20:42