
Historické prameny z Kladenska utřídil a propojil jedinečný software
17. 10. 2023
Ve spolupráci se specialisty z Massachusettského technologického institutu (MIT) ve Spojených státech amerických vzniká v Masarykově ústavu a Archivu AV ČR unikátní software, který umožní prohledat a spojit obrovské množství digitalizovaných historických pramenů a pomocí umělé inteligence je vyhodnotit. V průběhu příštího roku bude software na webové stránce přístupný veřejnosti. Ambicí vědců je propojovat nový software s archivy, knihovnami a dalšími institucemi po celém světě.
Například k badatelce z Argentiny se dostane originál německy psaného dopisu z protektorátu Čechy a Morava, dejme tomu z okresu Kladno. Dopis pečlivě naskenuje a vloží do specializovaného softwaru. Ten jí dopis přečte a přeloží. Píše se v něm mimo jiné o jistém úředníkovi vyhlášeném postihy za nedodržování vyhlášky o zákazu domácích porážek prasat. Historička si pročte vyhlášku, rozklikne si mapu okresu Kladno. Vyhledá, jak moc byly postihy za domácí zabijačky na Kladensku obvyklé, kdo, kde a jak byl za ně postihován, životopis onoho úředníka, zda byl přistižen i pisatel dopisu aj.
Tak bude zřejmě za pár let vypadat práce historiků – anebo zájemců o historii z řad veřejnosti. Týdny a měsíce objíždění archivů nebo desítky hodin vyhledávání a třídění pramenů a vytváření databází nahradí sofistikovaná práce s počítačem.
První takový komplexní software dokončují vědci z Masarykova ústavu a Archivu AV ČR ČR spolu s Kurtem Fendtem, který je ředitelem Iniciativy aktivních archivů (Active Archives Initiative) na MIT. V minulých dnech jej představili na prestižní třídenní konferenci Asociace německých studí v Montrealu, jíž se účastnilo přes 1000 vědců a vědkyň z celého světa. „Software umí propojit digitalizované vyhlášky, zákony, úřední protokoly nebo dopisy z jednoho regionu, konkrétně okresu Kladno, nabídne překladač a také služby umělé inteligence k osvětlení tématu a vyhodnocení konkrétního dotazu,“ vysvětluje Jan Vondráček, který vedl projekt českých historiků a amerických vývojářů z MIT, financovaný z programu MISTI-Czech Seed Fund, v němž se jedinečný software zrodil.
Archiv na psacím stole
Software, jehož zveřejnění se plánuje v příštím roce, spojuje několik v současnosti horkých technologických novinek: strojové učení, které umožňuje počítači přečíst rukopis a převést jej do textu, a také umělou inteligenci ChatGPT, kterou ovšem historici „odpojí“ od internetu a „nakrmí“ historickými dokumenty. Dalším krokem je třídění dat a jejich vizualizace, například do map.
„V budoucnu bychom chtěli přidat i překladač, aby byla data přístupná ve všech jazycích, a velkým snem je propojit software i s dalšími archivy nebo knihovnami po celém světě,“ říká Jan Vondráček.
Vzdáleným cílem, na nějž se hodlá vědec zaměřit v některém z dalších projektů, je software důkladně zdokonalit, případně převést do digitální podoby i další regiony. „Počítače, a hlavně ChatGPT je pro mě opravdu průmyslová revoluce, v níž žijeme. Nám historikům umožní úplně jiný styl práce, umožní klást nám jiné otázky a dovědět se odpovědi na ně radikálně rychleji,“ zdůrazňuje badatel.
Šance pro studenty i vědce
Program MISTI – Czech Seed Fund vznikl ve spolupráci MIT, Akademie věd ČR, Ústavu organické chemie a biochemie AV ČR a jeho dceřiné společnosti IOCB Tech. Nyní jej financuje Nadační fond IOCB Tech.
Projekt Jana Vondráčka Institutional Data Shaping Digital History byl první spoluprací z oblasti společenských věd. Česká strana digitalizovala archiv, v MIT vyvíjeli software. Spolupráce se odvíjela na základě online setkávání a jedné týdenní stáže přímo na MIT.
Dr. phil. Jan Vondráček se zabývá zejména dějinami druhé světové války a historií každodennosti a politické správy protektorátu Čechy a Morava. Vystudoval Technickou univerzitu v Darmstadtu, Univerzitu Ludvíka Maxmiliána v Mnichově a Technickou univerzitu v Chemnitzu. V Masarykově ústavu a Archivu AV ČR působí od roku 2019, soustředí se na nové přístupy pro digitální humanitní vědy (digital humanities) prostřednictvím digitalizace, tvorby databází a digitální analýzy.
Více informací:
Dr. phil. Jan Vondráček
Masarykův ústav a Archiv AV ČR
vondracek@mua.cas.cz
Přečtěte si také
- Čeští vědci detekovali požáry v kanadských lesích
- Nejcennější nálezy z výzkumu před stavbou Pražského okruhu
- Prémie Otto Wichterleho 2025
- Mapy zobrazující intenzitu sucha bude Intersucho nově aktualizovat denně
- Riziko horkých vln se zvyšuje; nový monitorovací a předpovědní web
- Výzkum odhalil detaily fungování enzymu, který reguluje sodík v těle
- Čeští vědci představí výsledky svého výzkumu nejznámějšího zlomu na světě
- Ve čtvrtek se Letňany otevřou tomu nejzajímavějšímu z výzkumu
- Web Agrorisk varuje před rizikem tepelného stresu pro skot i pro ryby
- Blízcí příbuzní prvních eukaryot využívají světlo jinak, než se doposud myslelo
Humanitní a filologické vědy
Vědecká pracoviště
- Etnologický ústav AV ČR
Filosofický ústav AV ČR
Orientální ústav AV ČR
Slovanský ústav AV ČR
Ústav pro českou literaturu AV ČR
Ústav pro jazyk český AV ČR
Výzkumné projekty ústavů této sekce mají rovněž význam pro celonárodní kulturu a vzdělanost. V literární vědě je třeba nově zpracovat poválečné období české literatury, včetně literatury nezávislé. Naproti tomu klasická studia se soustřeďují na latinské písemnictví v našich zemích a na soupis našich literárních památek do r. 1800. Jazykověda se orientuje na výzkum národního jazyka a jeho historického vývoje v jeho spisovné i nespisovné podobě. Pozornost filozofie je upřena ke studiu filozofických směrů 20. století - k fenomenologii, filozofii existence, ale i k analytické filozofii a teorii vědy - stejně jako k odkazu myslitelů jako J. A. Komenský či J. Patočka. Literatura a jazyky slovanských zemí jsou předmětem naší slavistiky. Orientalistika, která má u nás dlouhou tradici, se věnuje studiu orientálních jazyků, dějinám a kultuře Předního východu, Indie, Číny a arabského světa. Etnografie a folkloristika se vedle tradičních témat hmotné a duchovní lidové kultury zabývá i aktuálními problémy etnických studií emigrace a reemigrace i adaptací jiných etnik v českém prostředí. Rovněž výzkum české hudební kultury je příspěvkem této sekce k poznání a ochraně našeho kulturního dědictví. Sekce zahrnuje 6 ústavů s přibližně 360 zaměstnanci, z nichž je asi 250 vědeckých pracovníků s vysokoškolským vzděláním.