Kvant vs. kval: dvě perspektivy na stejnou otázku
Kvantitativní přístupy popisují realitu pomocí čísel, měření a statistických testů; kvalitativní přístupy zkoumají významy, kontexty a mechanismy prostřednictvím slov, obrazů a interakcí. Obě perspektivy se vzájemně doplňují. Klíčem k rozumnému výběru není „co je lepší“, ale jakou otázku kladete, jaká data máte a jaký typ rozhodnutí potřebujete učinit.
Kdy stačí deskriptivní analýza: rozhodovací situace s nízkým rizikem a jasným vzorem
- Mapování stavu: potřebujete vědět „kolik“ a „kde“ (počty, procenta, podíly, mediány, rozptyl). Příklady: odhad účasti na seminářích, distribuce známek, časové rozložení aktivit v LMS.
- Sledování trendů: pravidelně monitorujete směr a velikost změn (klouzavé průměry, kvartily, jednoduché indexy), bez ambice kauzálně vysvětlovat příčiny.
- Výběr priorit: rozhodnutí závisí spíše na pořadí než na přesnosti bodového odhadu (řazení témat podle četnosti výskytu chyb).
- Malá rozhodnutí: náklady chybného kroku jsou nízké; postačí robustní přehled (např. výběr 3 z 10 témat k zopakování podle četnosti otázek).
Deskriptivní analýza je často dostatečná, pokud odpověď nevede k zásadní investici nebo jsou vzory natolik výrazné, že přežijí i bez sofistikovaného modelu.
Kdy model nepotřebujete: signály „zbytečné“ inference
- Neodpovídající data: malý, nereprezentativní a zkreslený vzorek (např. dobrovolnický průzkum bez kontroly výběru) – model přidá falešnou přesnost.
- Jasný efekt velikosti: rozdíly jsou tak výrazné, že jsou zřejmé i hrubou deskriptivou (např. 20 % vs. 80 % úspěšnost).
- Neexistuje kauzální plán: bez designu (randomizace, přirozené experimenty, nástroje) nelze asociační data převést na příčinu – model nezachrání chybějící identifikační rámec.
- Nízká rozhodovací rizikovost: levné A/B rozhodnutí zvládnete pilotem a deskriptivní analýzou.
- Silná doménová priorita: když je teoretické očekávání i praktické omezení jasné (bezpečnostní limity v laboratoři), nepotřebujete fitovat prediktivní model.
Kdy deskriptiva nestačí: potřeba inference, modelu nebo kvalitativního prohloubení
- Generalizace: chcete odhadnout parametry populace nebo testovat hypotézy (intervaly spolehlivosti, testy významnosti, bayesovské odhady).
- Predikce: potřebujete spočítat pravděpodobnost budoucích událostí (regrese, rozhodovací stromy, logistické modely), protože rozhodnutí má finanční nebo reputační dopady.
- Kauzalita: zajímá vás efekt zásahu (RCT, difference-in-differences, RD, IV, syntetické kontroly) – deskriptiva nezachytí proti-faktuál.
- Mechanismy: kvantitativní data najdou vzor, proč k němu dochází, odhalí kvalitativní analýza (rozhovory, fokusové skupiny, pozorování).
Rozhodovací matice: která strategie odpovídá vaší otázce
| Typ otázky | Data | Riziko rozhodnutí | Doporučený přístup |
|---|---|---|---|
| „Kde jsme nyní?“ | Agregované metriky, popisy | Nízké | Deskriptiva + vizualizace |
| „Co se pravděpodobně stane?“ | Panelová/časová řada | Střední | Jednoduchý prediktivní model, validace pomocí holdoutu |
| „Co způsobuje změnu?“ | Experiment/kvázi-experiment | Vysoké | Kauzální design + robustní odhady |
| „Proč je to tak?“ | Rozhovory, dokumentace, teren | Střední | Kvalitativní analýza (tematizace, kódování) |
Pravidlo proporcionality: složitost metody vs. složitost rozhodnutí
Metodická náročnost by měla růst s vkladem a nejistotou. Pokud rozhodnutí mění kurikulum, rozpočet nebo reputaci, je rozumné přejít od deskriptivy k identifikačně čistému modelu (nebo kombinovanému designu). Naopak u drobných operativních voleb stačí kvalitní popis a kontrolní seznam rizik.
Deskriptiva, která je „slušná“: minimální standardy
- Rozdělení, ne jen průměry: mediány, kvartily, hustoty; u zkreslených dat se vyhněte průměrům bez kontextu.
- Intervaly nejistoty: i u deskriptivních statistik ukazujte intervaly spolehlivosti (bootstrapping při malém N).
- Segmentace: rozpad podle relevantních skupin (např. ročníky, typy úloh) s kontrolou multiplicitních porovnání.
- Vizualizace: boxploty, ridgeline grafy, ECDF; u malých vzorků náhodné body, aby byly viditelné reálné pozorování.
Kdy stačí kvalitativní přístup bez modelu
- Raný stupeň výzkumu: mapujete pojmy, procesy a aktéry (průzkumné rozhovory, pozorování).
- Komplexní jevy: význam závisí na kontextu (identita, motivace, interakce ve skupině) – čísla bez interpretace selhávají.
- Nízké množství případů, vysoká hloubka: když je případů málo, ale bohatých na data (případové studie, etnografie, analýza dokumentů).
- Potřebujete teoretický rámec: generování hypotéz pro následné kvantitativní testy.
Smíšené metody: postup „kval → kvant → kval“
- Kvalitativně identifikujte kategorie, hypotézy a mechanismy.
- Kvantitativně otestujte frekvenci, sílu a robustnost jevů.
- Kvalitativně interpretujte, proč výsledky vypadají tak, jak vypadají (včetně odchylek a kontextu).
Tento cyklus minimalizuje riziko „modelového dogmatismu“ nebo naopak „anekdotické slepoty“.
Model není cíl, ale nástroj: typické pasti
- Overfitting: model popisuje šum, ne signál; chybí validační plán (cross-validation, out-of-time testy).
- Pseudokauzalita: záměna korelace za příčinu; ignorování skrytých proměnných a výběrové zaujatosti.
- Černá skříňka bez interpretace: vysoká přesnost bez vysvětlitelnosti tam, kde je potřeba legitimace rozhodnutí.
- P-hacking a multiplicita: násobení testů bez korekce (Benjamini–Hochberg, Bonferroni podle potřeby).
Mini-případy: kdy byste model zbytečně přestříleli
- Didaktická intervence v jednom semináři: stačí deskriptivní přehled účasti a jednoduchá zpětná vazba.
- Porovnání dvou formátů kvízu: pokud je rozdíl v úspěšnosti 30 p. b. na vzorku 200 studentů, hrubá deskriptiva a jednoduchý test postačí; složitý prediktivní model nepřinese přidanou hodnotu.
- Výběr literatury pro opakování: četnosti chyb v úlohách jsou jasné; modelování neurychlí rozhodnutí.
Mini-případy: kdy bez modelu riskujete
- Reforma hodnocení: měníte pravidla pro stovky studentů – potřebujete simulaci dopadů a robustní odhady.
- Přijímací procesy: predikce úspěšnosti, spravedlnost a auditovatelnost; bez modelu a testu zaujatosti hrozí škody.
- Alokace zdrojů: rozpočet na tutoring podle rizika neúspěchu – vyžaduje prediktivní skóre a validaci.
Kontrolní seznam: rozhodnutí „deskriptiva vs. model vs. kval“
- Otázka: popis, predikce, kauzalita nebo význam?
- Data: kvalita vzorku, míra chybějících hodnot, sběr a výběrové mechanismy.
- Riziko: náklady špatné volby a potřeba legitimace.
- Validace: pokud použiji model, jak ověřím jeho zobecnitelnost a stabilitu?
- Interpretace: potřebuji vysvětlitelnost pro zainteresované strany?
- Etika: souhlas, ochrana soukromí, spravedlnost a dopady na skupiny.
Praktické šablony bez modelu (rychlé, ale disciplinované)
- Deskriptivní report: cíl (1 věta) → definice metrik → rozdělení a segmenty → hlavní zjištění (3–5 bodů) → omezení → doporučení (1 strana).
- Kvalitativní kódování: výběr vzorku → kódovací rámec (témata, subkódy) → spolehlivost kódování → syntéza vzorů → citace pro ilustraci → implikace.
- Smíšený rychlý průzkum: krátký rozhovor (N=10) na hypotézy → rychlá deskriptiva archivních dat → zpětná kvalitativní validace.
Když už model, tak robustně: minimální požadavky
- Předregistrace nebo plán analýzy: co testuji a jak rozhodnu za vícenásobných porovnání.
- Validační režim: holdout, cross-validation, smysluplné metriky (MAE, AUC, Brier), nejen přesnost.
- Senzitivní analýzy: alternativní specifikace, robustní standardní chyby, placebo testy.
- Čitelná interpretace: efekty v přirozených jednotkách, parciální závislosti, SHAP/ICE, nebo jednodušší modely.
Komunikace výsledků: význam nad formou
Bez ohledu na přístup platí: vysvětlete, co výsledky znamenají pro rozhodnutí a s jakou nejistotou. Ukázat, co by se změnilo, pokud by byly předpoklady porušeny. Raději menší počet dobře vysvětlených grafů než přetížené tabule čísel.
Etické a praktické limity
- Reidentifikace: i agregovaná čísla mohou ohrozit soukromí malých skupin; používejte minimální prahy a maskování.
- Zaujatost v datech: deskriptiva může odrážet historické nerovnosti; model je může reprodukovat – potřebná auditovatelnost.
- Transparentnost: dokumentujte kroky, rozhodnutí a limity – aby byly replikovatelné.
Právo na přiměřenost
Dobrá metodická praxe neznamená vždy „více modelu“. Znamená přiměřenost mezi otázkou, daty, rizikem a potřebou interpretace. Deskriptiva je rychlý, levný a často dostačující nástroj pro orientaci a operativní rozhodnutí. Kvalitativní přístup je nenahraditelný, když hledáte mechanismy a významy. Model má smysl tehdy, když potřebujete generalizovat, predikovat nebo identifikovat kauzální efekty – a v těchto případech si zaslouží disciplinovaný design, validaci a srozumitelnou komunikaci.