Esitelmiä
Extracting Geographical References from Finnish Literature. Fully Automated Processing of Plain-Text Corpora
Harri Kiiskinen, Asko Nivala, Jasmine Westerlund & Juhana Saarelainen
CCLS 2023 Würzburg – 2nd Annual Conference of Computational Literary Studies
Abstract
In the Atlas of Finnish Literature 1870–1940 project, we extract geographical information from a Finnish-language corpus of literary texts published between 1870 and 1940. The texts are transformed from plain texts to TEI/XML, and further processed with named entity recognition and linking tools. The results are presented in web-based environment. This article describes the technical structure of the analysis chain, the tools used and the metaprocesses used to manage the research dataset.
Kirjallisuuden koettu tila ja sen digitaalinen tutkimus
Asko Nivala, Jasmine Westerlund, Juhana Saarelainen & Harri Kiiskinen
Kirjallisuudentutkimuksen päivät 2023. Esitelmä on osa “Kirjallisuushistorian uudistuvat metodit” -työryhmää. Turku 4.5.2023 klo 13.00 – 14.45 (Arcanum, A270).
Abstrakti
Suomalaisen kirjallisuuden atlas -hankkeessa (Alfred Kordelinin säätiön suuret kulttuurihankkeet 2022–2024) kartoitamme suomalaisen kirjallisuuden kuvittelemaa tilaa vuosina 1870–1940. Hanke soveltaa neuroverkkoon perustuvaa nimentunnistusta, linkitettyä avointa dataa ja paikkatietojärjestelmiä kirjallisuushistorian tutkimukseen. Tavoitteenamme on tunnistaa suomenkielisessä kirjallisuudessa vuosina 1870–1940 mainitut paikannimet nimentunnistuksen avulla. Luokitamme toponyymit mm. geopoliittisiin alueisiin, luonnonpaikkoihin ja rakennuksiin. Koodamme tunnistetut paikat myös koneluettavina annotaatioina digitoituihin kokoteksteihin säilyttääksemme niiden alkuperäisen tekstiyhteyden. Rikastamme tunnistettuja paikannimiä linkittämällä ne avoimeen semanttiseen verkkoon (Wikidata), jolloin voimme myös yksilöidä viittauksen kohteena olevat tilalliset entiteetit ja yhdistää ne maantieteellisiin koordinaatteihin. Tästä syntyneen paikkatietojärjestelmän avulla luomme kotimaisen kirjallisuuden kartaston, joka julkaistaan hankkeen lopuksi interaktiivisena verkkosivuna sekä avoimena datasettinä.
Pohdimme esitelmässämme esimerkiksi sitä, kuinka kokemusta voidaan tutkia ja lähestyä tilallisesti ja kuinka nimentunnistusta, avointa linkitettyä dataa ja paikkatietojärjestelmiä voidaan hyödyntää tässä tutkimuksessa. Barbara Piattia mukaillen pohdimme, millaisia erilaisia tiloja kirjallisuudesta voidaan löytää. Ovatko kirjallisuutemme tilat ja paikat koettuja, kuviteltuja vai kenties muistettuja? Minkälaisia kokemuksia sijoittuu eri paikkoihin kartalla? Värittääkö pohjoista seikkailu ja Helsinkiä sivistys, vai sijoittuvatko kokemukset paikkoihin yllättävillä tavoilla?