Stačí studentovi za esej trojka? Dnes už za sebe může nechat psát počítač.

Stroje se stávají stále zdatnějšími autory textů. Jeden z nejlepších takových systémů současnosti je dokonce volně k vyzkoušení na internetu. Jak ale učitel pozná, že mu student místo výplodu vlastní inteligence neodevzdal seminární práci napsanou počítačem? Více se dozvíte v následujícím článku.

Jeden z nejmocnějších současných systémů, který umí sepsat přirozeně vyhlížející text, se jmenuje GPT-2. Minulý rok ho vyvinula nezisková iniciativa OpenAI. Je to v podstatě statistický model. Funguje podobně jako software v mobilním telefonu, který navrhuje uživateli při psaní zprávy následující slovo. Jen je komplikovanější a nenapsal ho lidský programátor. Používá neuronovou síť jménem Transformer. Ta se zvlášť hodí na zpracování dat, ve kterých záleží na pořadí, jako je třeba text. Autoři systému GPT-2 ji nechali, aby si psaní natrénovala na osmi milionech článků, které se líbily uživatelům sociální sítě Reddit.

Celý dataset měl asi čtyřicet gigabajtů. OpenAI původně nechtěla model GPT-2 publikovat na webu. Důvodem byly obavy, že by se dal využít ke generování fake news, případně nefiltrovatelného spamu, který by mohl zaplavit sociální sítě. Vloni na podzim ale představitelé nadace změnili názor a model zveřejnili. Momentálně si ho může každý vyzkoušet na adrese talktotransformer.com. Výsledek je docela dobrý, až na občasné opakování stejných frází a podobné drobné stylistické nedostatky.

Systém umí jen generovat věty, které vypadají realisticky. Nerozumí jim a neověřuje si informace. Argumentuje třeba vědeckými studiemi, které neexistují. Přesto je přesvědčivý. Kanadský antropolog Grant Jun Otsuki, toho času přednášející na Novém Zélandu, si nedávno na webu The Conversation postěžoval, že GPT-2 dokáže sepsat ucházející vysokoškolský esej.

Podle Otsukiho stačí na známku C, v českých poměrech tedy trojku. Jelikož je technooptimista, navrhuje systémy podobné GPT-2 (je jich víc, například BERT, ERNIE2.0 nebo XLNet) nezakazovat. Místo toho by se podle něj studenti měli učit psát s jejich využitím. Nechali by si od nich napsat první verzi textu podle svých poznámek, kterou by pak dál upravovali.

Současně se systémy na generování textu se ovšem zlepšují i způsoby, jak takový výtvor stroje rozeznat. Sebastian Gehrmann z Harvardu a Hendrik Strobelt z IBM vymysleli metodu založenou na měření předvídatelnosti textu. Pokud stroj dokáže snadno uhodnout následující slovo ve větě, je dost možné, že ji napsal jiný stroj.  K hádání používá zase model GPT-2. Proto také nejlépe pozná texty vygenerované jeho pomocí. Dokáže ale identifikovat i články, které napsal jiný systém. 

red NEWPS.CZ
info(@)newps.cz

 

 

 

 

Zpět na výpis novinek

NEWPS.CZ
Máte dotaz?
Zavolejte nám!

Naše webová stránka používá cookies

Data o tom, co vás na našem webu zajímá, sdílíme s našimi partnery pro sociální média, inzerci a analýzy.
Partneři tyto údaje mohou použít s dalšími informacemi, které jste jim poskytli nebo které získali v důsledku toho, že používáte jejich služby.

OK

Druhy cookies

1. Nutné cookies pomáhají základním funkcím této stránky, jako je navigace stránky a přístup k zabezpečeným sekcím webové stránky. Webová stránka nemůže správně fungovat bez těchto cookies.

2. Preferenční cookies umožňují, aby si webová stránka zapamatovala vaše preference. Je to například preferovaný jazyk nebo region, kde se nacházíte.

3. Statistické cookies nám pomáhají porozumět tomu, jak návštěvníci používají webové stránky. Statistické cookies anonymně sbírají informace.

4. Marketingové cookies používáme pro sledování návštěvníků na našich stránkách. Záměrem je zobrazit vám reklamu, která je pro vás relevantní a neobtěžuje vás.

5. Neklasifikované cookies máme v procesu klasifikování společně s poskytovateli jednotlivých cookies.

Co jsou cookies?

Cookies jsou malé textové soubory, které mohou být používány webovými stránkami, aby učinily uživatelský zážitek více efektivní.

Podle zákona můžeme ukládat cookies na vašem zařízení, pokud jsou nezbytně nutné pro provoz této stránky. Pro všechny ostatní typy cookies potřebujeme vaše povolení.

Tato stránka používá různé typy cookies. Některé cookies jsou umístěny službami třetích stran, které se objevují na našich stránkách.