ChatGPT by se na střední nedostal, propadl z matiky

Tereza Malkusová

11 měsíců ago

Umělá inteligence (neboli AI) se těší velké popularitě. Dokáže obrovské množství zajímavých věcí: Nakreslit obrázek roztomilého psa? Napsat slohovou práci? Vytvořit inzerát? Vyřešit domácí úkoly? Žádný problém! Právě díky této technologii se můžeme těšit na chytré aplikace, které nám usnadní práci. Jak je to ale ve skutečnosti?

Rozhodli jsme se prověřit ChatGPT od společnosti OpenAI a nechali jsme jej vyřešit několik úloh z matematiky. Jste zvědaví, jak to dopadlo? Zjistíme, zda může být umělá inteligence užitečná dítěti při řešení domácích úkolů. Tak pojďme na to.

ChatGPT se zkouší propočítat na střední školu

Robotovi jsme zadali 5 otázek z přijímacích zkoušek na střední školy pro rok 2023. Úlohy, které jsme vybrali najdete na stránkách Centra pro zjišťování výsledků vzdělávání. Konkrétní otázky jsme vybírali spíše náhodně, vy můžete klidně zkusit zadání jiných.

Robotovi jsme zadali úlohu prostřednictvím rozhraní aplikace ChatGPT. Pokud byla odpověď nesprávná, napověděli jsme umělé inteligenci, že odpověď musí opravit. Pokud robot stále nedokázal odpovědět správně, prozradili jsme mu výsledek a chtěli popsat, jak k němu dojít.

Rovnice o dvou neznámých? Za 5!

Pojďme se podívat, jak robot vyřešil zadání rovnice o dvou neznámých.

Zadání 1. úlohy: Celý film trvá 1 hodinu. Doba, která ještě zbývá do konce filmu, je polovinou doby, která již uplynula od začátku filmu. Vypočtěte, kolik minut zbývá do konce filmu.
Správná odpověď: 20 minut

Robot bleskurychle vypálil řešení, které ale není správně. Už na startu je to pro nás mírné zklamání, protože jsme očekávali, že si poradí umělá inteligence s matematikou lépe. No nic, pokusíme se AI nasměrovat ke správné odpovědi.

Je hezké, že má robot vychování a omluvil se za nesprávnou odpověď, ale vzápětí nám odpověděl opět špatně. Úloha je těžká na pochopení i pro nezkušené matikáře. Co se stane, když řekneme robotovi odpověď a necháte ho úkol znovu spočítat?

Nula minut?! Nejraději bychom to nyní s umělou inteligencí vzdali, ale zkusíme tzv. přegenerovat odpověď. Už od robota opravdu nic nečekáme.

A světe div se. Je tu správná odpověď s obsáhlým vysvětlením, ale po nápovědě, a velké. To nemůžeme uznat jako vyřešené.

Zlomky a procenta dává levou zadní

Zadání 2. úlohy: Roman i Jana jezdili během dovolené na kole. Roman ujel 400 km, což bylo o čtvrtinu více, než ujela Jana. Kolik km ujela na kole během dovolené Jana?

Správná odpověď: 320 km

Robot nás mile překvapil. Vysolil nám zcela správné řešení na první pokus. Popravdě bychom to očekávali pokaždé. Úspěšnost AI je 50 %. Že by umělá inteligence potřebovala nějaký čas na rozehřátí a bude už naše úlohy řešit bravurně? Uvidíme.

Zadání 3. úlohy: V roce 2020 firma vyrobila 250 výrobků. Jak v roce 2021, tak v roce 2022 vyrobila firma vždy o 20 % výrobků více než v předchozím roce. Kolik výrobků vyrobila firma v roce 2022?

Správná odpověď: 360

Výborně robote. Tak se nám to líbí. Úspěšnost AI se zvyšuje na 66 %. Jdeme na předposlední úlohu. Udrží si robot nastavenou laťku?

Počítání geometrických úloh? Jako hodit si mincí

Zadání 4. úlohy: Vnitřní objem sudu je 15krát větší než objem kbelíku. Objem kbelíku je 5krát větší než objem konvičky. Ze sudu plného vody jsme třetinu vody odebrali, takže v něm zbylo 60 litrů vody. Vypočtěte v litrech objem konvičky.

Správná odpověď: 1,2 litru

Opět správná odpověď. Robot se dostává na úspěšnost 75 %. Začínáme si myslet, že nám z robota vyrostl matematický génius. Zbývá poslední úloha.

Zadání 5. úlohy: Kvádr je možné beze zbytku rozřezat na 200 krychlí, z nichž každá má objem 8 dm³. Vypočtěte, na kolik krychliček o objemu 1 cm³ lze tento kvádr beze zbytku rozřezat.

Správná odpověď: 1 600 000 krychliček

Umělá inteligence opět selhala. Zkusme ji alespoň dovést ke správnému řešení.

Tak znovu a lépe. Zkusíme jí opět prozradit výsledek, ať se k němu propočítá.

Uměla inteligence v našem testu matematických dovedností neobstála. Vyřešila správně bez pomoci 3 z 5 úloh, což je 60% úspěšnost. Kdybychom měli výsledek oznámkovat, bylo by to za 3.

AI nechápe ani kontext a nepozná nepravdu

Jak je možné, že někdy umělá inteligence vypálí správné řešení bez jediného zaváhání a jindy nepochopí zadání a správnou odpověď přestřelí? Musíme si uvědomit, že umělá inteligence chápe text jinak než člověk. Její schopnost porozumění obsahu a kontextu je založená na matematických vzorcích a statistikách, nikoli na skutečném porozumění či vnímání významu.

ChatGPT využívá velké jazykové modely, které v některých případech oslní vygenerovanými texty, které vypadají logicky a srozumitelně, ale mohou zároveň obsahovat nepřesnosti a chyby.

AI neumí rozlišovat mezi pravdivými a nepravdivými tvrzeními. Její „znalosti“ jsou založené jen na větných vztazích nikoli na pochopení pravdy.

AI vám bude klidně lhát. Proto je důležité přistupovat k informacím poskytnutým umělou inteligencí s určitou mírou opatrnosti. Úsudek člověka by měl hrát klíčovou roli při vyhodnocování správnosti a relevantnosti generovaných textů a odpovědí.

Vyplatí se používat umělou inteligenci?

Pokud jste si mysleli, že domácí úlohy budou díky umělé inteligenci hotové raz dva, a děti si budou moci užít více volného času, budete asi zklamáni. AI zkrátka není geniální a vlastně ani moc chytrá.

Při řešení úloh jsme narazili na známý jev, kterému se říká halucinace umělé inteligence. To je princip, kdy si robot vymyslí odpověď nebo její část, která je nepravdivá, ale prezentuje ji takovým způsobem, že vypadá jako pravdivá.

V případě domácích úloh, kdy známe správný výsledek, dokážeme tyto halucinace odhalit, a dokonce můžeme robota přivést na správné řešení. Co ale uděláme, když správnou odpověď neznáme? Děti se seznamují s mnoha informacemi poprvé a je pro ně těžší odlišit fakta od zavádějících informací. Je tedy nutné chápat umělou inteligenci pouze jako pomocníka.

Umělá inteligence ovšem dokáže podpořit dítě v učení. Například tím, že mu napoví způsob řešení nebo dokáže rozvinout text a inspirovat dítě k vlastní tvorbě. Aplikace umělé inteligence při řešení domácích úkolů zatím nedokáže nahradit roli rodiče či učitele. Náročnější a rozsáhlejší úkoly si stále vyžadují lidskou asistenci.