Kvant vs. kval: dvě perspektivy na tutéž otázku
Kvantitativní přístupy popisují realitu pomocí čísel, měření a statistických testů; kvalitativní přístupy zkoumají významy, kontexty a mechanismy prostřednictvím slov, obrazů a interakcí. Obě perspektivy se vzájemně doplňují. Klíčem k rozumnému výběru není „co je lepší“, ale jakou otázku pokládáte, jaká data máte a jaký typ rozhodnutí potřebujete učinit.
Kdy postačuje deskriptivní analýza: rozhodovací situace s nízkým rizikem a jasným vzorem
- Mapování stavu: potřebujete vědět „kolik“ a „kde“ (počty, procenta, podíly, mediány, rozptyl). Příklady: odhad účasti na seminářích, rozložení známek, časové rozvržení aktivit v LMS.
- Monitoring trendů: pravidelně sledujete směr a velikost změn (klouzavé průměry, kvartily, jednoduché indexy) bez ambice kauzálně vysvětlovat příčiny.
- Výběr priorit: rozhodnutí záleží spíše na pořadí než na přesnosti bodového odhadu (ranking témat podle četnosti výskytu chyb).
- Malá rozhodnutí: náklady chybného kroku jsou nízké; postačí robustní přehled (např. výběr 3 z 10 témat k zopakování podle četnosti otázek).
Deskriptivní přístup je často dostatečný, pokud rozhodnutí nevede k zásadní investici nebo jsou vzory natolik výrazné, že přetrvají i bez sofistikovaného modelu.
Kdy model není třeba: signály „zbytečné“ inferenční analýzy
- Nevhodná data: malý, nereprezentativní a zkreslený vzorek (např. dobrovolnický průzkum bez kontroly výběru) – model přidá falešnou přesnost.
- Jasný efekt velikosti: rozdíly jsou tak výrazné, že jsou viditelné i hrubou deskriptivní analýzou (např. 20 % vs. 80 % úspěšnost).
- Není k dispozici kauzální plán: bez designu (randomizace, přirozené experimenty, instrumenty) nelze asociační data přetavit v příčinu – model nezachrání chybějící identifikační rámec.
- Nízká rizikovost rozhodnutí: levné A/B rozhodnutí zvládnete pilotem a deskriptivní analýzou.
- Silná doménová priorita: když je teoretické očekávání i praktické omezení jasné (bezpečnostní limity v laboratoři), nepotřebujete fitovat prediktivní model.
Kdy deskriptivní analýza nestačí: potřeba inferenční analýzy, modelu nebo kvalitativního prohloubení
- Generalizace: chcete odhadnout parametry populace nebo testovat hypotézy (intervaly spolehlivosti, testy významnosti, bayesovské odhady).
- Predikce: potřebujete spočítat pravděpodobnost budoucích událostí (regrese, rozhodovací stromy, logistické modely), protože rozhodnutí má finanční nebo reputační dopady.
- Kauzalita: zajímá vás efekt zásahu (RCT, difference-in-differences, RD, IV, syntetické kontroly) – deskriptivní analýza nezachytí protikauzální scénář.
- Mechanismy: kvantitativní analýza odhalí vzor, ale proč k němu dochází prozradí kvalitativní zkoumání (rozhovory, fokusní skupiny, pozorování).
Rozhodovací matice: která strategie odpovídá vaší otázce
| Typ otázky | Data | Riziko rozhodnutí | Doporučený přístup |
|---|---|---|---|
| „Kde jsme teď?“ | Agregované metriky, popisy | Nízké | Deskriptivní analýza + vizualizace |
| „Co se pravděpodobně stane?“ | Panelová data / časové řady | Střední | Jednoduchý prediktivní model, validace přes holdout |
| „Co způsobuje změnu?“ | Experiment / kvázi-experiment | Vysoké | Kauzální design + robustní odhady |
| „Proč to tak je?“ | Rozhovory, dokumenty, terén | Střední | Kvalitativní analýza (tematizace, kódování) |
Pravidlo proporcionality: složitost metody vs. složitost rozhodnutí
Metodická náročnost by měla růst s vkladem a nejistotou. Pokud rozhodnutí mění kurikulum, rozpočet nebo reputaci, je rozumné přejít od deskriptivní analýzy k identifikačně čistému modelu (nebo smíšenému designu). Naopak při drobných operativních volbách stačí dobře zpracovaný popis a kontrolní seznam rizik.
Deskriptivní analýza, která je „slušná“: minimální standardy
- Rozdělení, ne jen průměry: mediány, kvartily, hustoty; u zkreslených dat se vyhněte průměrům bez kontextu.
- Intervaly nejistoty: i u deskriptivní analýzy ukažte intervaly spolehlivosti (bootstrap při malém počtu pozorování).
- Segmentace: rozčlenění podle relevantních skupin (např. ročníky, druhy úloh), ale s kontrolou násobných porovnání.
- Vizualizace: boxploty, ridgeline, ECDF; náhodné body při malých vzorcích, aby bylo vidět skutečná pozorování.
Kdy postačí kvalitativní přístup bez modelu
- Raný stupeň výzkumu: mapujete pojmy, procesy a aktéry (průzkumné rozhovory, pozorování).
- Komplexní jevy: význam závisí na kontextu (identita, motivace, interakce ve skupině) – čísla bez interpretace selhávají.
- Nízký počet případů, vysoká hloubka: když je případů málo, ale bohatých (případové studie, etnografie, analýza dokumentů).
- Potřeba teoretického rámce: generování hypotéz pro následné kvantitativní testy.
Smíšené metody: postup „kval → kvant → kval“
- Kvalitativně identifikujte kategorie, hypotézy a mechanismy.
- Kvantitativně otestujte četnost, sílu a robustnost jevů.
- Kvalitativně interpretujte, proč výsledky vypadají tak, jak vypadají (včetně odchylek a kontextu).
Tento cyklus minimalizuje riziko „modelové dogmatizace“ nebo naopak „anekdotické slepoty“.
Model není cíl, ale nástroj: typické falešné kroky
- Overfitting: model popisuje šum, nikoli signál; chybí validační plán (cross-validation, out-of-time testy).
- Pseudokauzalita: záměna korelace za příčinu; ignorování skrytých proměnných a výběrových zkreslení.
- Černá skříňka bez interpretace: vysoká přesnost bez vysvětlitelnosti tam, kde potřebujete legitimizovat rozhodnutí.
- P-hacking a multiplicita: násobení testů bez korekce (Benjamini–Hochberg, Bonferroni podle potřeby).
Mini-případy: kdy byste model zbytečně předimenzovali
- Didaktická intervence v jednom semináři: stačí deskriptivní přehled účasti a jednoduchá zpětná vazba.
- Porovnání dvou formátů kvízu: pokud je rozdíl v úspěšnosti 30 procentních bodů na vzorku 200 studentů, hrubá deskriptivní analýza a jednoduchý test postačí; hluboký prediktivní model nepřinese užitek.
- Výběr literatury k opakování: četnosti chyb v úlohách jsou jasné; modelování neurychlí rozhodnutí.
Mini-případy: kdy bez modelu riskujete
- Reforma hodnocení: měníte pravidla pro stovky studentů – potřebujete simulaci dopadů a robustní odhady.
- Přijímací procesy: predikce úspěšnosti, spravedlnost a auditovatelnost; bez modelu a testu zaujatosti hrozí škody.
- Alokace zdrojů: rozpočet na doučování podle rizika neúspěchu – vyžaduje prediktivní skóre a validaci.
Kontrolní seznam: rozhodnutí „deskriptivní analýza vs. model vs. kval“
- Otázka: popis, predikce, kauzalita nebo význam?
- Data: kvalita vzorku, míra chybějících hodnot, mechanismy sběru a výběru.
- Riziko: náklady špatné volby a potřeba legitimizace.
- Validace: pokud použiji model, jak ověřím jeho zobecnitelnost a stabilitu?
- Interpretace: potřebuji vysvětlitelnost pro zainteresované strany?
- Etika: souhlas, ochrana soukromí, spravedlnost a dopady na skupiny.
Praktické šablony bez modelu (rychlé, ale disciplinované)
- Deskriptivní report: cíl (1 věta) → definice metrik → rozdělení a segmentace → hlavní zjištění (3–5 bodů) → omezení → doporučení (1 stránka).
- Kvalitativní kódování: výběr vzorku → kódovací rámec (témata, subkódy) → spolehlivost kódování → syntéza vzorů → citace pro ilustraci → implikace.
- Smíšený rychlý průzkum: krátký rozhovor (N=10) o hypotézách → rychlá deskriptivní analýza archivních dat → zpětná kvalitativní validace.
Když už model, tak robustně: minimální požadavky
- Předregistrace nebo plán analýzy: co testuji a jak rozhodnu vzhledem k násobným porovnáním.
- Validační režim: holdout, cross-validation, smysluplné metriky (MAE, AUC, Brier), ne jen přesnost.
- Senzitivity: alternativní specifikace, robustní standardní chyby, placeba.
- Čitelná interpretace: efekty v přirozených jednotkách, parciální závislosti, SHAP/ICE, nebo jednodušší modely.
Komunikace výsledků: smysl nad formou
Bez ohledu na přístup platí: vysvětlete, co výsledky znamenají pro rozhodnutí a s jakou nejistotou. Ukažte, co by se změnilo, kdyby byla porušena předpoklady. Raději menší počet dobře vysvětlených grafů než přeplněné tabulky čísel.
Etické a praktické limity
- Reidentifikace: i agregovaná čísla mohou ohrozit soukromí malých skupin; používejte minimální prahy a maskování.
- Bias v datech: deskriptiva může odrážet historické nerovnosti; model je může reprodukovat – nezbytná auditovatelnost.
- Transparentnost: dokumentujte kroky, rozhodnutí a omezení – aby byla replikovatelná.
Právo na přiměřenost
Dobrý metodický přístup neznamená vždy „více modelu“. Znamená přiměřenost mezi otázkou, daty, rizikem a potřebou interpretace. Deskriptiva je rychlý, levný a často postačující nástroj pro orientaci a operativní rozhodnutí. Kvalitativní přístup je nenahraditelný, když hledáte mechanismy a významy. Model má smysl tehdy, když potřebujete generalizovat, predikovat nebo identifikovat kauzální efekty – a tehdy si zaslouží disciplinovaný design, validaci a srozumitelnou komunikaci.