Proč studenti opouštějí vysoké školy? Klíčem jsou výsledky, nikoliv demografie

Z výzkumu

To, že přibližně polovina studentů bakalářské studium nedokončí, je problém, se kterým se potýkají univerzity po celém světě. Pro školy to znamená finanční ztráty, pro společnost pak nevyužitý potenciál na trhu práce. Lze ale dopředu poznat, kdo ze studia odejde, a včas mu podat pomocnou ruku? Výzkum Petra Berky a Luboše Marka z Fakulty informatiky a statistiky VŠE v Praze ukazuje, že ohrožené studenty lze identifikovat včas a s vysokou přesností.

Rozhoduje první rok a ztracené kredity

Při analýze úspěšnosti studentů se často sledují faktory jako věk, pohlaví nebo typ absolvované střední školy. Výzkum však ukazuje, že tyto vstupní údaje mají pro předpověď jen minimální váhu. Nejsilnějším varovným signálem je procento nezískaných (ztracených) kreditů.

Pokud student nesplní povinné předměty, dostává se do kruhu: v dalším semestru musí vynaložit mimořádné úsilí, aby dohnal resty, což zvyšuje stres a pravděpodobnost, že se nakonec rozhodne školu opustit. Ideální moment pro včasné varování nastává na konci prvního ročníku. V této fázi už modely dokáží s 85% úspěšností určit, kdo ve studiu setrvá, a zároveň zbývá prostor pro případnou intervenci nebo studijní poradenství.

Jazyková bariéra jako vedlejší faktor

Z dat také vyplynulo, že u programů vyučovaných v českém jazyce hraje roli i národnost. Studenti, pro které čeština nebo slovenština není rodným jazykem, končí se studiem častěji. Nejspíš nejde o to, že by látce nerozuměli po odborné stránce, ale narážejí na jazykovou bariéru – prostě se v cizím jazyce hůře adaptují na tempo výkladu a vysokoškolské prostředí jako takové.

Srozumitelnost vs. přesnost: Proč „vyhrály“ stromy?

Výzkumníci porovnávali různé algoritmy, které se učí z historických dat. Zaměřili se především na dvě metody:

Logistická regrese: Tradiční statistická metoda, která vypočítává pravděpodobnost výsledku na základě kombinace mnoha faktorů.
Rozhodovací stromy: Logické schéma, které dělí studenty do skupin podle konkrétních kritérií (např. „Získal student více než 20 kreditů? Pokud ne, je cizinec?“).

I když byla logistická regrese na historických datech o něco přesnější, u autorů studie zvítězily rozhodovací stromy. Ukázaly se totiž jako stabilnější (stromy vytvořené pro studenty, kteří nastoupili v různých letech, se od sebe příliš nelišily) a robustnější (fungovaly spolehlivě i na datech nových studentů). Pro praxi je zásadní i jejich čitelnost – vedení fakulty nebo studijní poradci díky nim přesně vidí, jaké jsou hlavní faktory studijní neúspěšnosti a na základě jakých charakteristik byl konkrétní student označen za rizikového z hlediska úspěšného dokončení studia.

O výzkumu a metodice

Analýzu provedli Petr Berka a Luboš Marek z Fakulty informatiky a statistiky VŠE v Praze. Pracovali s anonymizovanými daty studentů bakalářských programů z let 2013–2018 a sledovali dvě roviny dat:

Vstupní údaje: Věk, pohlaví, typ střední školy či státní občanství.

Studijní výsledky: Počty získaných a ztracených kreditů a průměr známek v jednotlivých semestrech.

Cílem bylo zjistit, která z těchto skupin dat má větší váhu pro včasné odhalení rizika ukončení studia. Unikátnost této studie spočívá v tom, že vědci své modely ověřovali v čase. Netestovali je pouze na historických datech ze stejného roku, ale zkoumali, zda model vytvořený na studentech z roku 2013 dokáže správně předpovědět neúspěch studentů, kteří nastoupili o několik let později.

Pohled do budoucna

Autoři v závěru článku podotýkají, že univerzita není jeden homogenní tým a jednotlivé fakulty či obory mohou mít svá specifika a předměty, které jsou „strašáky“. Budoucí analýzy by se proto měly zaměřit na tyto jemnější rozdíly, aby byla pomoc studentům ještě adresnější.

Při přípravě tohoto popularizačního článku byly konzultovány nástroje umělé inteligence.