Kvalitativní vs. kvantitativní analýza: kdy postačuje deskriptivní přehled bez složitých modelů

Kvant vs. kval: dvě perspektivy na tutéž otázku

Kvantitativní přístupy popisují realitu pomocí čísel, měření a statistických testů; kvalitativní přístupy zkoumají významy, kontexty a mechanismy prostřednictvím slov, obrazů a interakcí. Obě perspektivy se vzájemně doplňují. Klíčem k rozumnému výběru není „co je lepší“, ale jakou otázku pokládáte, jaká data máte a jaký typ rozhodnutí potřebujete učinit.

Kdy postačuje deskriptivní analýza: rozhodovací situace s nízkým rizikem a jasným vzorem

  • Mapování stavu: potřebujete vědět „kolik“ a „kde“ (počty, procenta, podíly, mediány, rozptyl). Příklady: odhad účasti na seminářích, rozložení známek, časové rozvržení aktivit v LMS.
  • Monitoring trendů: pravidelně sledujete směr a velikost změn (klouzavé průměry, kvartily, jednoduché indexy) bez ambice kauzálně vysvětlovat příčiny.
  • Výběr priorit: rozhodnutí záleží spíše na pořadí než na přesnosti bodového odhadu (ranking témat podle četnosti výskytu chyb).
  • Malá rozhodnutí: náklady chybného kroku jsou nízké; postačí robustní přehled (např. výběr 3 z 10 témat k zopakování podle četnosti otázek).

Deskriptivní přístup je často dostatečný, pokud rozhodnutí nevede k zásadní investici nebo jsou vzory natolik výrazné, že přetrvají i bez sofistikovaného modelu.

Kdy model není třeba: signály „zbytečné“ inferenční analýzy

  • Nevhodná data: malý, nereprezentativní a zkreslený vzorek (např. dobrovolnický průzkum bez kontroly výběru) – model přidá falešnou přesnost.
  • Jasný efekt velikosti: rozdíly jsou tak výrazné, že jsou viditelné i hrubou deskriptivní analýzou (např. 20 % vs. 80 % úspěšnost).
  • Není k dispozici kauzální plán: bez designu (randomizace, přirozené experimenty, instrumenty) nelze asociační data přetavit v příčinu – model nezachrání chybějící identifikační rámec.
  • Nízká rizikovost rozhodnutí: levné A/B rozhodnutí zvládnete pilotem a deskriptivní analýzou.
  • Silná doménová priorita: když je teoretické očekávání i praktické omezení jasné (bezpečnostní limity v laboratoři), nepotřebujete fitovat prediktivní model.

Kdy deskriptivní analýza nestačí: potřeba inferenční analýzy, modelu nebo kvalitativního prohloubení

  • Generalizace: chcete odhadnout parametry populace nebo testovat hypotézy (intervaly spolehlivosti, testy významnosti, bayesovské odhady).
  • Predikce: potřebujete spočítat pravděpodobnost budoucích událostí (regrese, rozhodovací stromy, logistické modely), protože rozhodnutí má finanční nebo reputační dopady.
  • Kauzalita: zajímá vás efekt zásahu (RCT, difference-in-differences, RD, IV, syntetické kontroly) – deskriptivní analýza nezachytí protikauzální scénář.
  • Mechanismy: kvantitativní analýza odhalí vzor, ale proč k němu dochází prozradí kvalitativní zkoumání (rozhovory, fokusní skupiny, pozorování).

Rozhodovací matice: která strategie odpovídá vaší otázce

Typ otázky Data Riziko rozhodnutí Doporučený přístup
„Kde jsme teď?“ Agregované metriky, popisy Nízké Deskriptivní analýza + vizualizace
„Co se pravděpodobně stane?“ Panelová data / časové řady Střední Jednoduchý prediktivní model, validace přes holdout
„Co způsobuje změnu?“ Experiment / kvázi-experiment Vysoké Kauzální design + robustní odhady
„Proč to tak je?“ Rozhovory, dokumenty, terén Střední Kvalitativní analýza (tematizace, kódování)

Pravidlo proporcionality: složitost metody vs. složitost rozhodnutí

Metodická náročnost by měla růst s vkladem a nejistotou. Pokud rozhodnutí mění kurikulum, rozpočet nebo reputaci, je rozumné přejít od deskriptivní analýzy k identifikačně čistému modelu (nebo smíšenému designu). Naopak při drobných operativních volbách stačí dobře zpracovaný popis a kontrolní seznam rizik.

Deskriptivní analýza, která je „slušná“: minimální standardy

  • Rozdělení, ne jen průměry: mediány, kvartily, hustoty; u zkreslených dat se vyhněte průměrům bez kontextu.
  • Intervaly nejistoty: i u deskriptivní analýzy ukažte intervaly spolehlivosti (bootstrap při malém počtu pozorování).
  • Segmentace: rozčlenění podle relevantních skupin (např. ročníky, druhy úloh), ale s kontrolou násobných porovnání.
  • Vizualizace: boxploty, ridgeline, ECDF; náhodné body při malých vzorcích, aby bylo vidět skutečná pozorování.

Kdy postačí kvalitativní přístup bez modelu

  • Raný stupeň výzkumu: mapujete pojmy, procesy a aktéry (průzkumné rozhovory, pozorování).
  • Komplexní jevy: význam závisí na kontextu (identita, motivace, interakce ve skupině) – čísla bez interpretace selhávají.
  • Nízký počet případů, vysoká hloubka: když je případů málo, ale bohatých (případové studie, etnografie, analýza dokumentů).
  • Potřeba teoretického rámce: generování hypotéz pro následné kvantitativní testy.

Smíšené metody: postup „kval → kvant → kval“

  1. Kvalitativně identifikujte kategorie, hypotézy a mechanismy.
  2. Kvantitativně otestujte četnost, sílu a robustnost jevů.
  3. Kvalitativně interpretujte, proč výsledky vypadají tak, jak vypadají (včetně odchylek a kontextu).

Tento cyklus minimalizuje riziko „modelové dogmatizace“ nebo naopak „anekdotické slepoty“.

Model není cíl, ale nástroj: typické falešné kroky

  • Overfitting: model popisuje šum, nikoli signál; chybí validační plán (cross-validation, out-of-time testy).
  • Pseudokauzalita: záměna korelace za příčinu; ignorování skrytých proměnných a výběrových zkreslení.
  • Černá skříňka bez interpretace: vysoká přesnost bez vysvětlitelnosti tam, kde potřebujete legitimizovat rozhodnutí.
  • P-hacking a multiplicita: násobení testů bez korekce (Benjamini–Hochberg, Bonferroni podle potřeby).

Mini-případy: kdy byste model zbytečně předimenzovali

  • Didaktická intervence v jednom semináři: stačí deskriptivní přehled účasti a jednoduchá zpětná vazba.
  • Porovnání dvou formátů kvízu: pokud je rozdíl v úspěšnosti 30 procentních bodů na vzorku 200 studentů, hrubá deskriptivní analýza a jednoduchý test postačí; hluboký prediktivní model nepřinese užitek.
  • Výběr literatury k opakování: četnosti chyb v úlohách jsou jasné; modelování neurychlí rozhodnutí.

Mini-případy: kdy bez modelu riskujete

  • Reforma hodnocení: měníte pravidla pro stovky studentů – potřebujete simulaci dopadů a robustní odhady.
  • Přijímací procesy: predikce úspěšnosti, spravedlnost a auditovatelnost; bez modelu a testu zaujatosti hrozí škody.
  • Alokace zdrojů: rozpočet na doučování podle rizika neúspěchu – vyžaduje prediktivní skóre a validaci.

Kontrolní seznam: rozhodnutí „deskriptivní analýza vs. model vs. kval“

  • Otázka: popis, predikce, kauzalita nebo význam?
  • Data: kvalita vzorku, míra chybějících hodnot, mechanismy sběru a výběru.
  • Riziko: náklady špatné volby a potřeba legitimizace.
  • Validace: pokud použiji model, jak ověřím jeho zobecnitelnost a stabilitu?
  • Interpretace: potřebuji vysvětlitelnost pro zainteresované strany?
  • Etika: souhlas, ochrana soukromí, spravedlnost a dopady na skupiny.

Praktické šablony bez modelu (rychlé, ale disciplinované)

  • Deskriptivní report: cíl (1 věta) → definice metrik → rozdělení a segmentace → hlavní zjištění (3–5 bodů) → omezení → doporučení (1 stránka).
  • Kvalitativní kódování: výběr vzorku → kódovací rámec (témata, subkódy) → spolehlivost kódování → syntéza vzorů → citace pro ilustraci → implikace.
  • Smíšený rychlý průzkum: krátký rozhovor (N=10) o hypotézách → rychlá deskriptivní analýza archivních dat → zpětná kvalitativní validace.

Když už model, tak robustně: minimální požadavky

  • Předregistrace nebo plán analýzy: co testuji a jak rozhodnu vzhledem k násobným porovnáním.
  • Validační režim: holdout, cross-validation, smysluplné metriky (MAE, AUC, Brier), ne jen přesnost.
  • Senzitivity: alternativní specifikace, robustní standardní chyby, placeba.
  • Čitelná interpretace: efekty v přirozených jednotkách, parciální závislosti, SHAP/ICE, nebo jednodušší modely.

Komunikace výsledků: smysl nad formou

Bez ohledu na přístup platí: vysvětlete, co výsledky znamenají pro rozhodnutí a s jakou nejistotou. Ukažte, co by se změnilo, kdyby byla porušena předpoklady. Raději menší počet dobře vysvětlených grafů než přeplněné tabulky čísel.

Etické a praktické limity

  • Reidentifikace: i agregovaná čísla mohou ohrozit soukromí malých skupin; používejte minimální prahy a maskování.
  • Bias v datech: deskriptiva může odrážet historické nerovnosti; model je může reprodukovat – nezbytná auditovatelnost.
  • Transparentnost: dokumentujte kroky, rozhodnutí a omezení – aby byla replikovatelná.

Právo na přiměřenost

Dobrý metodický přístup neznamená vždy „více modelu“. Znamená přiměřenost mezi otázkou, daty, rizikem a potřebou interpretace. Deskriptiva je rychlý, levný a často postačující nástroj pro orientaci a operativní rozhodnutí. Kvalitativní přístup je nenahraditelný, když hledáte mechanismy a významy. Model má smysl tehdy, když potřebujete generalizovat, predikovat nebo identifikovat kauzální efekty – a tehdy si zaslouží disciplinovaný design, validaci a srozumitelnou komunikaci.