Umělá inteligence je jednou z nejdiskutovanějších oblastí současné vědy a techniky. Svou popularitu u široké veřejnosti získala především příchodem ChatGPT (Generative Pre-trainedTransformer) v roce 2022 a následně i dalšími kreativními modely určenými pro tvorbu textů, obrázků nebo hudby. V této souvislosti je možné jmenovat např. DALL-E, Midjourney či OpenAIJukebox. Velký rozmach kreativní tvorby umělé inteligence je však spojen i s řadou právních otázek, týkajících se především potenciální kolize s autorskými právy. Níže dojde k přiblížení problematiky strojového učení pro tvorbu umělé inteligence v kontextu autorského práva.
Hned v úvodu je příhodné podotknout, že umělá inteligence (dále také jako „AI“) v sobě zahrnuje několik podskupin – strojové učení, hluboké učení apod. (viz diagram níže) Na umělou inteligenci proto nelze nahlížet jako na monolitický subjekt, ale naopak právě jako na širokou oblast, jež v sobě zahrnuje různé technologické přístupy.
„Strojové učení“ (angl. „machine learning“) může být z hlediska autorského práva problematické. Jedná se totiž o model, který pracuje s obrovským množstvím dat, jež následně analyzuje, uspořádá do souvislostí a poté vyhodnotí. Počítač se de facto sám učí z dat, které mu jsou poskytnuty (či lépe řečeno, ke kterým má přístup), a zlepšuje se vlastními zkušenostmi, aniž by byl explicitně naprogramovaný. Právně problematické však v tomto ohledu může být to, z jakých datových zdrojů počítač/AI při strojovém učení čerpá.
Tvůrci generativní AI pro strojové učení nezřídka využívají veřejně přístupná autorská díla jiných autorů (např. se může jednat o texty, obrázky či fotografie) k jejichž užití nemají souhlas. Strojové učení tedy může být v kolizi s autorskými majetkovými právy autora, neboť se může jednat o neoprávněné užití autorského díla.
Na tuto problematiku legislativně reagovala Evropská unie, a to Směrnicí Evropského parlamentu a Rady (EU) 2019/790 o autorském právu a právech s ním souvisejících na digitálním trhu, kterou byly povinni transponovat do svého právního řádu všechny členské státy EU. Díky ní bylo do českého autorského zákona transponováno nové ustanovení § 39c, které se vztahuje na strojové učení - „Do práva autorského nezasahuje ten, kdo zhotoví rozmnoženinu díla za účelem automatizované analýzy textů nebo dat v digitální podobě, prováděné za účelem získání informací, zahrnujících mimo jiné vzory, tendence a souvztažnosti; takto zhotovenou rozmnoženinu je oprávněn uchovat pouze po dobu nezbytnou pro účely této automatizované analýzy textů nebo dat.“
Dané ustanovení zakotvuje nový druh zákonné licence, tzv. licenci k rozmnožování díla pro účely automatizované analýzy textů nebo dat. Není přitom rozhodné, zda se jedná o komerční užití či nikoliv. Podmínkou je pouze to, že vytěžená data budou užívána jen po nezbytnou dobu, a zároveň pokud autor předmětného autorského díla, jež je vytěžováno, neučinil výhradu s vytěžováním. Tato výhrada musí mít strojově čitelnou formu (tedy nestačí ji jen učinit v samotném díle) a to proto, aby mohla být lehce zaregistrovaná modelem umělé inteligence.
Strojově čitelná forma výhrady není nijak právně konkretizovaná a nejsou stanoveny ani žádné specifické technické parametry. Sdružení pro internetový rozvoj (SPIR) nicméně doporučuje řešit předmětnou výhradu např. doplněním následné formulace do souboru robots.txt příslušného autorského díla, jež se volně vyskytuje na internetu:
User-agent: MachineLearning
Disallow: /
A dále do patičky internetové stránky uvést následující text:
Automatické vytěžování textů a dat z této internetové stránky ve smyslu čl. 4 směrnice 2019/790/EU je bez souhlasu <majitel autorských práv> zakázáno.
Pokud uvedený či jinak obdobný (strojově čitelný) text není u autorského díla uveden, nebude se jednat o kvalifikovanou výhradu autora a umělá inteligence je v takovém případě oprávněna dané autorské dílo užít v rámci svého strojového učení.
Závěr
Uvedený formát výhrady (tzv. opt-out) je nepochybně velmi vhodný s ohledem na masivní rozvoj umělé inteligence, s kterým souvisí i potřeba vytěžování dat. Opačný princip, tj. možnost užití díla pro strojového užití pouze v případě explicitního souhlasu autora, by nebyl praktický. Na druhou stranu teprve čas ukáže, zda nastavený režim je skutečně nejoptimálnější. S ohledem na množství všech dat může být např. komplikované zpětně ověřit, zda AI autorovu výhradu skutečně respektovala.