Digitalna humanistika: viri, orodja in metode
Ključne besede: Digitalna humanistika, digitalne izdaje, zgodovinske zbirke, ustna zgodovina, korpusno jezikoslovje, strojno učenje, mešane metode, jezikovne tehnologije, govorne tehnologije, računalniški vid.
Šifra raziskovalnega programa: P6-0436
Obdobje trajanja raziskovalnega programa: 1. 1. 2022 – 31. 12. 2027
Obseg programa: 2,5 FTE
Finančni vir: Javna agencija za raziskovalno dejavnost Republike Slovenije (ARRS)
Vodja: dr. Darja Fišer
Partnerji in člani programa:
- Inštitut za novejšo zgodovino (nosilna institucija): dr. Darja Fišer, dr. Andrej Pančur, dr. Mojca Šorn, dr. Ajda Pretnar, Filip Dobranić, dr. Jakob Lenardič, dr. Ganna Kryvenko, Jure Skubic, dr. Ksenija Bogetić Pejović.
- Univerza v Ljubljani, Fakulteta za računalništvo in informatiko: dr. Matija Marolt, dr. Matevž Pesek, dr. Alenka Kavčič.
- Univerza v Ljubljani, Filozofska fakulteta: dr. Jakob Lenardič, Kristina Pahor de Maiti
Digitalizacija kulturne dediščine v Sloveniji zaostaja za evropskim povprečjem. Z izjemo korpusnega jezikoslovja in literarne zgodovine, ki razpolagata s številnimi bogato označenimi in mednarodno priznanimi korpusi in znanstvenokritičnimi izdajami, je datafikacija raziskovalnih virov v slovenski humanistiki močno fragmentirana, ti pa so obenem v veliki meri nezdružljivi, saj uporabljajo različne standarde kodiranja. Vse to jasno kaže, da v Sloveniji še niso izpolnjeni pogoji, ki bi nudili ustrezno podporo sodobnim podatkovno usmerjenim raziskavam na področju digitalne humanistike, kar omejuje tako raziskovalno dejavnost v Sloveniji kot njeno mednarodno prepoznavnost. Raziskovalni program naslavlja tri glavne raziskovalne probleme: (1) razvoj in uvedbo naprednih delotokov za izdelavo in objavo zanesljivih, interpretabilnih, interoperabilnih in bogato označenih kompleksnih digitalnih izdaj; (2) razvoj in promocijo novih interdisciplinarnih kvantitativnih in kvalitativnih metod za slovensko digitalno humanistiko; in (3) razvoj in vrednotenje naprednih tehnologij za obdelavo, obogatitev in vizualizacijo heterogenih večmodalnih in večjezičnih zgodovinskih podatkov.
Znanstveni okvir predlaganega raziskovalnega programa je izrazito interdisciplinaren in temelji na korpusnem in računalniškem jezikoslovju ter strojnem učenju, pri čemer se program raziskovalno osredotoča na eno- in večjezične zbirke pisnih, govornih in slikovnih podatkov in metapodatkov, relevantnih za slovensko sodobno zgodovinopisje, medijske študije, politologijo in antropologijo. Razvoj in uvedba jezikovnotehnoloških metod v slovensko digitalno humanistiko je ključnega pomena, saj bodo le-te bistveno doprinesle k celovitejšemu razumevanju preteklih in trenutnih družbenih pojavov v evropskem kontekstu. V programu bodo razvite tudi nove tehnologije, ki bodo omogočale digitalizacijo raziskovalnih podatkov in kulturne dediščine za potrebe digitalne humanistike.
V programu bomo izvedli celoten raziskovalni cikel digitalne humanistike, ki vključuje zajem, organizacijo, shranjevanje, obogatitev, analizo, vizualizacijo in interpretacijo podatkov ter diseminacijo pridobljenih rezultatov. Čeprav metode in tehnologije, razvite v programu, niso omejene na določene zbirke podatkov, bo program prispeval 6 novih dragocenih multimodalnih podatkovnih zbirk za digitalno humanistiko. V programu bomo izboljšali metode za digitalizacijo kompleksnih zgodovinskih dokumentov, razvili nove metode za transkripcijo posnetkov iz ustne zgodovine ter se vključili v razvoj mednarodno novih metod za računalniško obdelavo slik v zgodovinskih dokumentih. V programu bomo prav tako prilagodili jezikovne tehnologije in orodja za obogatitev besedil za zgodovinske in narečne jezikovne različice. Omogočili bomo podporo za proučevanje večjezičnih dokumentov, pomebnih za raziskovanje slovenske zgodovine. Program bo razvil tudi napredne mešane metode za mrežno, geoprostorsko in časovno analizo digitalnohumanističnih podatkov.