Ohjelmistot
Olemme julkaisseet GitHub:ssa ohjelmiston extract-georef-finlit. Julkaisu sisältää Suomalaisen kirjallisuuden atlas -hankkeessa kehitetyn sovelluksen, jolla voidaan segmentoida rakenteettomassa – ns. plain-text muodossa – toimitettuja kaunokirjallisia teoksia sekä tunnistaa niissä mainittuja nimettyjä entiteettejä. Lisäksi sovellus suorittaa teksteille lauseenjäsennyksen ja tallentaa tekstit XML TEI-standardin mukaiseen muotoon sekä JSON/Markdown-muotoon verkkosivuilla esittämistä varten.
Clojure-kielellä kirjoitettu sovellus on dokumentoitu Emacs org-babel notebook -muodossa. Tämä mahdollistaa ohjelmakoodin interaktiivisen suorittamisen omalla koneellasi asennusohjeiden mukaisesti.
Ohjelmisto on julkaistu avoimella MIT-lisenssillä ja voit viitata siihen DOI-osoitteella: