Esittely

Suomalaisen kirjallisuuden atlas 1870–1940 -verkkosovelluksella voi lukea aineistoon kuuluvia kaunokirjallisia teoksia sekä tarkastella kartalla aineistosta automaattisesti tunnistettuja maantieteellisiä paikkoja. Tämän voi tehdä esimerkiksi yhden teoksen sisällä, kirjailijan tuotannossa tai paikkalähtöisesti. Myös koko aineiston kaikki paikat saa esille yhdessä näkymässä. Sovellus on suunniteltu käytettäväksi ennen kaikkea tietokoneella, mutta se toimii myös mobiililaitteilla.

Sovelluksen keskeinen hyöty on aineistosta tunnistettujen paikkojen mielekkääseen hakemiseen, rajaamiseen ja järjestämiseen tarjotut työkalut sekä tulosten esittäminen kartalla. Tunnistettuja paikkoja voidaan tarkastella järjestämällä niitä esimerkiksi paikannimen, kirjailijan nimen, teoksen nimen, julkaisuvuoden, edition tai lajityypin mukaan. Järjestettyä aineistoa voi edelleen rajata ajallisesti vuoden tarkkuudella ja vapaalla hakusanalla.

Haun, järjestämisen ja rajaamisen eri menetelmiä yhdistelemällä voi esimerkiksi


Sovelluksen perusnäkymät ja kartta

Sovelluksen käyttäminen on yksinkertaista. Sen oikeassa reunassa on aina esillä kartta, jonka näkymää käyttäjä voi muokata yläkulmasta: karttapohjaksi voi valita joko satelliittikuvan tai rantaviivan erottavan vektorikartan. Lisäksi tunnistettujen paikkojen esitystavaksi voidaan valita joko yksittäiset tunnistetut paikat tai toisilleen läheisten paikkojen klusterit eli ryppäät.

Sovelluksen vasemmalta puolelta käyttäjällä on valittavissa neljä erilaista perusnäkymää, joista kolme ensimmäistä mahdollistavat eri tapoja tarkastella kaunokirjallista aineistoa ja sen suhdetta maantieteellisiin paikkoihin sekä neljäs näkymä, joka mahdollistaa vapaan sanahaun koko aineistosta:

Teokset

Teokset-näkymän valitsemalla käyttäjä saa esille luettelon kaikista tietokannan teoksista järjestettynä oletusarvoisesti julkaisuvuoden mukaan. Teoksen nimen ja tekijän lisäksi luettelo kertoo sen julkaisuvuoden, lajityypin ja tekstin alkuperäisen edition (joko Projekti Lönnrot tai Project Gutenberg).

Luettelosta voi etsiä teoksia muuttamalla järjestysperiaatetta, aikahaarukkaa ja tekemällä vapaita sanahakuja. Sanahaku kohdistuu koko luetteloon, siten esimerkiksi hakusana “draama” tai “lyriikka” rajaa luetteloon vain nämä lajityypit.

Valitsemalla luettelosta ”kartalle” tuo sovellus ko. teoksesta tunnistetut paikat näkyviin oikeanpuoleiselle karttapohjalle. Valitsemalla luettelosta teoksen nimen, saa käyttäjä sekä teoksen sisällön luettavaksi että luettelon teoksesta tunnistetuista paikoista.

Teoksen lukunäkymän yläosassa on Paikat teoksessa -luettelo eli listaus valitusta teoksesta tunnistetuista paikannimistä, jotka esitetään samanaikaisesti myös kartalle sijoitettuina. Luettelo on järjestetty paikannimien tekstikohtaisen esiintymismäärän mukaan, ja sen voi helposti piilottaa otsikkoa klikkaamalla. Käyttäjä voi myös muokata luettelon järjestystä sekä tehdä sitä koskevia vapaita sanahakuja.

Kaunokirjallisten teosten lukunäkymässä on esillä oletusarvoisesti teoksen koko teksti, mutta teosta voi lukea myös osio kerrallaan. Lajityypistä riippuen osio voi olla esimerkiksi luku, novelli tai näytös. Valitsemalla luettavaksi yhden osion, ainoastaan siitä löydetyt paikkamaininnat tuodaan näkyviin oikeanpuoleiseen karttaan. Teoksen tekstiin hakuja voi tehdä vain selaimen omalla hakutoiminnolla.

Kirjailijat

Kirjailijat-näkymä on sukunimen mukaan aakkosjärjestyksessä ja siihen voi tehdä vapaita sanahakuja. Valitsemalla luettelosta ”kartalle” käyttäjä saa karttapohjalle näkyviin kaikki paikkamaininnat, jotka on tunnistettu kirjailijan tietokannasta löytyvistä teoksista.

Valitsemalla luettelosta kirjailijan nimen tuodaan vasemmanpuoleiseen näkymään tarkempi luettelo kirjailijan tuotannosta tunnistetuista paikoista. Luettelo antaa paikan nimen ohella mahdollisen Wikidata-linkin, paikan kategorian (ks. alempana) ja mainintojen lukumäärän ko. kirjailijan tuotannossa. Luettelon oletusjärjestys on mainintojen määrän mukaan. Luetteloon voi tehdä vapaita sanahakuja. Valitsemalla luettelossa nimetyn paikan siirrytään Paikat-perusnäkymään, joka listaa kaikki ne teokset, joista on tunnistettu vähintään yksi maininta kyseisestä paikasta.

Kirjailijat-näkymään voi avata paikkaluettelon lisäksi hakemiston kaikista kyseisen kirjailijan teoksista hankkeen tietokannassa. Lisäksi Kirjailijat-näkymään on joissakin tapauksissa mahdollista saada Wikidatasta peräisin olevia tietoja kirjoittajasta.

Paikat

Paikat-näkymä tuo sovelluksen karttaan kaikki tietokannasta tunnistetut paikkamaininnat. Vasemmalla puolella sovellus näyttää luettelon näistä kaikista tunnistetuista paikoista järjestettynä oletusarvoisesti mainintojen määrän mukaan. Tietokannan suuresta koosta johtuen kartan ja luettelon latautuminen saattaa kestää tavallista pidempään.

Paikan nimen lisäksi luettelo kertoo myös paikan kategorian (ks. tarkemmin alla), sen Wikidata- ja OpenStreetMap -linkin sekä mahdollisesti kuvauksen paikasta. Luetteloon voi tehdä vapaita sanahakuja, ja sitä voi järjestää eri tavoin.

Valitsemalla luettelosta yhden paikan nimen, sovellus tuo näkyviin kaikki tietokannan teokset, joista on tunnistettu maininta ko. paikasta. Tätäkin luetteloa voi rajata vuoden tarkkuudella ja vapaalla sanahaulla. Sitä voi myös järjestää kirjoittajan, teoksen nimen, julkaisuvuoden, mainintojen määrän ja luokan mukaan.

Sanahaku

Vaikka sovelluksen keskeinen tarkoitus on yhdistää aineistosta tunnistetut paikat karttapohjalle, on siihen lisätty mahdollisuus vapaaseen sanahakuun, joka on käyttöliittymän neljäs perusnäkymä. Siten sovellus ei rajoitu vain maantieteellisten paikkojen tarkasteluun, sillä sanahaulla voi etsiä mitä tahansa sanaa tai fraasia. Vapaata sanahakua voi luonnollisesti käyttää myös maantieteellisen tarkastelun apuna esimerkiksi etsittäessä mainintoja tietystä paikasta, jota automaattinen nimentunnistus ei kenties ole löytänyt. Haun tarkemmat ohjeet löytyvät hakunäkymän oikealta puolelta.


Paikkojen kategoriat

Automaattisesti tunnistetut maantieteelliset kohteet on luokiteltu poliittis-kulttuurisiin paikkoihin (GPE), luonnonpaikkoihin (LOC) ja rakennettuihin paikkoihin (FAC). Jokaiseen kategoriaan sisältyy laaja määrä erityyppisiä paikkoja. Esimerkiksi poliittis-kulttuurisiin paikkoihin kuuluvat kaupungit, kunnat ja valtiot, kuten myös kaupunginosat ja kylät. Luonnonpaikat ovat muun muassa järviä, saaristoja ja vuoria. Rakennettuihin paikkoihin puolestaan sisältyvät esimerkiksi yksittäiset kadut, kirkot ja rautatiet.

Kartalla ja kaunokirjallisen aineiston sisällöissä nämä erityyppiset paikat on erotettu toisistaan värikoodein:

Teoksissa alleviivatut entiteetit on linkitetty Wikidataan. Kun valitsee teoksesta alleviivatun paikan, voi avata Wikidata-sivun ja löytää kyseisen paikan sijainnin kartalta.


Todelliset ja fiktiiviset paikat

Maantieteellisten kohteiden automaattinen tunnistus ei rajoitu todellisiin paikkoihin, vaan myös fiktiivisiä paikkoja on tunnistettu. Asia tulee esille esimerkiksi virkkeessä ”Jukolan talo, eteläisessä Hämeessä, seisoo erään mäen pohjaisella rinteellä, liki Toukolan kylää.” Tässä tapauksessa ”Jukolan talo” on tunnistettu paikaksi (FAC), mutta sitä ei ole alleviivattu tai sijoitettu kartalle, koska fiktiiviselle kohteelle ei löydy täsmällistä paikkaa. Sen sijaan ”Hämeessä” on tunnistettu (GPE) sekä alleviivattu ja sijoitettu kartalle. Myös Toukola on tunnistettu paikaksi (GPE) ja alleviivattu. Se kuitenkin paikantuu virheellisesti, koska tämän fiktiivisen paikan ohella löytyy Helsingistä samanniminen todellinen kaupunginosa (tulosten tarkkuudesta ks. enemmän alla).


Muut kuin paikannimet

Automaattinen nimettyjen kohteiden tunnistus ei rajoitu vain maantieteellisiin paikkoihin. Nämä muutkin tulokset on jätetty näkyviin teoksiin, ja niistä kaunokirjallisuuden kannalta keskeisimmät on värikoodattu seuraavasti:

Niiden lisäksi seuraavat tunnistetut kohteet on merkitty tekstiin yhteisellä harmaalla värillä:


Tulosten tarkkuus

Verkkosovelluksen mahdollistaa koneoppiminen, mutta se tuottaa myös paikoitellen epätarkkuuksia. Niitä on pyritty manuaalisesti karsimaan, mutta suuresta aineistosta jokaista virhettä ei voi poistaa käsityönä. Siksi verkkosovellusta käytettäessä on hyvä olla tietoinen satunnaisista epätarkkuuksista. Siitä esimerkiksi puuttuu joitain teoksissa mainittuja paikkoja, kuten ”Pohjolan Manchester”, joka on tunnistettu paikaksi, mutta ei Tampereeksi, joten karttasijaintia sille ei ole löytynyt. Toisaalta osa tuloksista on paikannettu väärin. Esimerkiksi fiktiivinen paikka ”Pohjolan pirtti” on paikantunut Helsingin Lammassaaressa sijaitsevaan samannimiseen todelliseen rakennukseen. Lisäksi tulokset saattavat ajoittain olla epätarkkoja tai monitulkintaisia. Esimerkiksi Havaiji tunnistuu sekä luonnonpaikaksi (saariryhmä) että poliittis-kulttuuriseksi paikaksi (osavaltio). Puuttuvien, virheellisten tai epätarkkojen tulosten osuus on kuitenkin verrattain pieni suhteessa laajaan aineistoon.


Miten viittaan tietokantaan?

Kun käytät verkkosovellusta ja julkaiset sen avulla saatuja tietoja merkitse viitteeksi ”Suomalaisen kirjallisuuden atlas 1870–1940 (https://atlas-data.utu.fi/)”.

Lähdeluetteloon merkitse verkkosovellus seuraavasti: Suomalaisen kirjallisuuden atlas 1870–1940. Toim. Nivala, Asko; Hietamäki, Ville; Kiiskinen, Harri; Saarelainen, Juhana; Westerlund, Jasmine. Turku 2024. https://atlas-data.utu.fi/.