Time Machine lupaa ratkaisuja kulttuuriperintöalan avainkysymyksiin

Euroopan kulttuuriperintötoimijoita kootaan yhteen

Euroopasta kuului tänään hyviä uutisia: Time Machine FET Flagship –hankeaihion ympärille rakentuvaan Time Machine –organisaatioon (TMO) on ilmoittautunut jo yli 400 kulttuuriperintöalaan eri tavoin sidoksissa olevaa organisaatiota – muistiorganisaatioita, yliopistoja ja muita tutkimuslaitoksia sekä alalla toimivia yrityksiä.

Jäsenmäärän kasvu on ollut voimakasta, sillä vielä keväällä organisaatioita oli 200, Suomesta Kansallisarkiston lisäksi Helsingin yliopisto (HELDIG) ja Aalto-yliopisto. Nyt Suomesta ovat mukana myös Kansalliskirjasto ja Musiikkiarkisto. Lisäksi muutamat muut tahot harkitsevat omaa osallistumistaan.

Time Machine on muutenkin kiinnostavassa vaiheessa: se on yhtenä kuudesta finalistista kilpailemassa EU:n uuden ja nousevan teknologian rahoitukseen kohdennettavasta miljardin euron rahoituspotista. Alkuaan hankkeita oli mukana 30. Kun komissio viime vuoden lopulla pisteytti jäljellä olevat kilpailijat, sijoittui Time Machine joukossa ensimmäiseksi. Ensi vuoden jälkipuolella se käy läpi finalistien lopulliset hankehakemukset ja päättää miljardin euron potin jakamistavasta. Mikäli Time Machine on rahoituksen saajien joukossa, alkaisi noin 10 vuoden pituiseksi kaavailtu projekti vuonna 2021.

Time Machine -hankeaihio katsoo sekä menneisyyteen että tulevaisuuteen:
historian aineistot halutaan digitaalisiksi ja tekoälypohjaisten sovellusten piiriin.
Kuva: Time Machine Organisation
Hankeaihion sisältö

Miksi Time Machine sitten on niin kiinnostava? Siksi, että toteutuessaan projekti lupaa ratkaista aikamme suurimmat kysymykset, joita on pyritty eri tavoin ratkaisemaan jo yli vuosikymmenen ajan.

Ensinnäkin Time Machine aikoo kehittää huomattavan nopean vanhojen aineistojen digitointiratkaisun, jolla Euroopan arkistoissa, kirjastoissa ja museoissa säilytettävät historian aineistot voidaan saattaa laajassa mitassa digitaaliseen muotoon. Tämän tavoitteen toteutuminen olisi suurta, sillä esimerkiksi Suomessa Kansallisarkisto on digitoinut aineistojaan kaikin keinoin jo 15 vuoden ajan melkeinpä Euroopan ennätysvauhtia, mutta digitointiaste on edelleen noin 5 prosentin tuntumassa. Meidän ikäpolvellemme luontevasti sopiva tehtävä digitoinnin suorittamisesta uhkaakin nykyteknologialla paisua ylisukupolviseksi urakaksi.

Toiseksi Time Machine pyrkii kehittämään pitkäaikaisratkaisun massadigitoinnilla tuotettavan menneisyyden big datan säilyttämiseen. Sen yhteydessä on puhuttu synteettisen DNA:n hyödyntämisestä. Se vaikuttaa lupaavalta, sillä DNA:n pitkäaikaissäilymisen edellytykset tunnetaan, minkä lisäksi myös tulevat sukupolvet pystynevät lukemaan DNA:ta riippumatta siitä, mihin suuntaan tekninen kehitys etenee.

Kolmas Time Machinen tavoite on luoda ratkaisuja ja palveluita, joilla kansalaiset, tutkijat ja muut käyttäjäryhmät voivat päästä tuotettavan digitaalisen kulttuuriperintömme ääreen ja hyödyntää yhteistä dataa aivan uusilla tavoilla. Tavoitteena on siis ensiluokkainen tekoälytuote, jonka avulla voidaan esimerkiksi etsiä ja yhdistellä kulttuuriperintöaineistoihin sisältyviä tietoja uudella tavalla.

Merkittävää hankeaihiossa on myös alussa mainittu Time Machine –organisaatio (TMO). Verkoston toiminnan on määrä jatkua, vaikkei itse projekti lopulta toteutuisikaan. TMO tarjoaa tulevina vuosina jäsenilleen kumppanuuksia sekä kansallisella että Euroopan tasolla. Jäsenyys verkostossa on toistaiseksi maksuton, mutta jatkossa jäsenyydestä peritään 0-2000 euron vuotuinen maksu. Maksu perustuu valittuun jäsenyysluokkaan, eikä esimerkiksi organisaation kokoon.

Suomen rooli hankkeessa

Suomella on mahdollisesti toteutuvassa hankkeessa paitsi paljon saatavaa, myös paljon annettavaa. Meillä on runsaasti osaamista esimerkiksi digitoinnissa, metatietotyössä ja käyttöliittymäsuunnittelussa. Myös tekoälyosaamiseen on satsattu Suomessa paljon. Kansallisarkiston kannalta miellyttävää on, että projektiaihion eri tasoilla toimii lukuisia henkilöitä ja organisaatioita, joiden kanssa olemme jo vuosia olleet toimivassa ja jatkuvassa yhteistyössä. Työskentely vanhojen tuttujen kanssa voi vauhdittaa Suomen tavoitteita hankkeessa.

Yhdessä voimme olla kokoamme suurempia – tule mukaan!

Allekirjoittanut on saanut tehtäväksi toimia Time Machinen kansallisena yhteyshenkilönä. Kiitos luottamuksesta eurooppalaisille kollegoille! Ensimmäisenä toiveenani tehtävässä on, että kaikki kulttuuriperintöalalla toimivat tai hankkeen tavoitteista muuten kiinnostuneet organisaatiot muodostaisivat pikimmiten kantansa hankesuunnitteluun osallistumiseen.

Yhdessä voimme olla kokoamme suurempia. Osallistumisen ensimmäinen askel on rekisteröityminen TMO:n jäseneksi. Se tehdään englanninkielisellä verkkolomakkeella. Syksyllä on tarkoituksena järjestää tapaaminen suomalaisten TMO-jäsenten kesken ja sopia yhteistoiminnan muodoista siitä eteenpäin.

Minuun voi olla yhteydessä hankeaihioon liittyvissä mieltä askarruttavissa kysymyksissä. Tervetuloa mukaan kaikki asiasta kiinnostuneet! Katsotaan yhdessä tämä kortti ja se, miten voimme osaltamme edistää hankkeen tärkeitä tavoitteita.

Tomi Ahoranta
kehittämispäällikkö, Time Machine –hankkeen kansallinen yhteyshenkilö
Kansallisarkisto
tomi.ahoranta@arkisto.fi
p. 0295 33 7004

Poimintoja Kansallisarkiston asiakaskyselystä 2019


Kansallisarkiston asiakaspalveluun ja verkkopalveluihin kohdistunut kysely oli tänä vuonna avoinna kaksi viikkoa ja se toteutettiin sekä verkossa että paperiversiona toimipaikkojen tutkijasaleissa. Vastauksia saimme verkossa ennätysmäärän, 440 kappaletta. Paperikyselyitä palautui 24 kappaletta, joten seuraava kysely toteutetaan ainoastaan sähköisenä. Edellinen, yksinomaan sähköisenä toteutettu kysely vuonna 2017 tuotti 160 vastausta.

Kansallisarkisto tarjoaa ratkaisuja sähköiseen säilyttämiseen


Digitaalisen säilyttämisen päivää vietetään 29.11.2018. Päivän tarkoitus on kertoa tehdyistä saavutuksista sekä tulevasta. Kansallisarkisto tarjoaa  ratkaisuja ja palveluita sekä julkiselle hallinnolle että yksityisarkistoja luovuttaville.

Erilaiset tallennusmuodot ja järjestelmät vanhentuvat nopeammin kuin sen tiedon arvo, jonka olemme tallentaneet. Jokaisen organisaation ja kansalaisen tulee toimia vastuullisesti, jotta myös tulevaisuudessa tutkijoilla ja muilla tiedontarvitsijoilla on luotettavaa tietoa käytettävissään selvittäessään tämän ajan ilmiöitä.

Säilyttämisen palveluita valtiolle


Kansallisarkisto on tarjonnut osana lakisääteisiä tehtäviään sähköisen säilyttämisen palvelua valtionhallinnon käyttöön jo vuodesta 2011. Uudistettu palvelu avattiin  tänä syksynä. Palvelun avulla viranomaiset  voivat siirtää Kansallisarkiston palveluun  digitoituja ja alkujaan digitaalisessa muodossa olevia asiakirjoja ja rekistereitä. Säilyttäminen on maksutonta ja Kansallisarkisto vastaa säilymisestä.

”Preservation-by-Design” toimintomallina tarkoittaa, että säilyttäminen huomioidaan jo tietojärjestelmän suunnittelussa. Kansallisarkisto on kehittänyt kansallisia asiakirjahallinnan käytäntöjä Sähke-määritysten avulla. Nämä määritykset turvaavat tiedon luotettavuuden ja sen siirtämisen Kansallisarkiston palveluun.

Kansallisarkisto ohjaa ja kouluttaa julkishallinnon sähköistä asiakirjahallintaa ja  säilyttämistä.  Lähtökohtana luotettavalle ja kustannustehokkaalle säilyttämiselle on asiakirjahallinnan, säilytyksen ja käytön tarpeiden huomiointi  aineiston käsittelyssä ja organisaation toiminnassa.

Lisää tietoa Kansallisarkiston palveluista valtionhallinnon toimijoille saat kotisivultamme: https://www.arkisto.fi/digitaalisetsiirrot.

Kansallisarkisto säilyttää yksityisarkistoja


Kansallisarkisto  on keskeinen toimija myös yksityisarkistojen säilyttämisessä. Voimme kuitenkin ottaa säilytettäväksi vain oman hankintapolitiikkamme mukaista merkittävää aineistoa niin paperimuotoisena kuin digitaalisena. Jokaiselle meistä kuitenkin muodostuu omaan elämään ja toimintaan liittyviä ainakin itselle merkittäviä tietoaineistoja. Näiden säilymisen tueksi olemme koonneet oheisen lyhyen tietopaketin ohjeeksi ja opastukseksi.

1. Löydä säilyttämisen arvoinen
Käytämme useita verkkopalveluita valokuvillemme, kirjoitamme sosiaaliseen mediaan ja pidämme yllä blogia, viestimme sähköpostilla tai hoidamme tietokoneella yhdistyksen asiakirjahallintoa. Olemme digitaalisesti läsnä monessa muodossa ja paikassa. Asiakirjallista tietoa on myös erilaisilla tallennusvälineillä sekä oman koneen kovalevyllä. Nämä tulee paikallistaa ja miettiä mikä on toiminnan dokumentoitumisen kannalta keskeistä. Voit käyttää hyväksesi Kansallisarkiston yksityisarkistojen seulontaohjetta.

2. Kokoa, luokittele ja kuvaile aineistosi
Kokoa säilyttämisen arvoinen ja muodosta sellaisia loogisia rakenteita hakemistojen avulla, jotka auttavat sekä omaa järjestämistyötä että tulevia tutkijoita ja muita hyödyntäjiä. Aineisto tulee kuvailla, jotta sitä voidaan ymmärtää ja käyttää. Aineiston tallennuksen järjestäminen on osa kuvailua, jota voi toteuttaa luomalla selkeän hakemistorakenteen ja antamalla selkeitä tiedostonimiä. Varsinaista kuvailua on kuitenkin se että kerrotaan aineistosta ja sen taustoista. Kansallisarkistolla on ohjeet yksityisarkistojen kuvailemiseen liittyen.

3. Tallenna säilytyskelpoisessa muodossa
Kaikki tiedostomuodot eivät säily samalla tavalla.  Tiedostot voivat olla tallessa, mutta niiden avaamiseen ei löydy sovellusta. Sen vuoksi tulisi käyttää Kansallisarkiston suosittelemia säilytysmuotoja.  Jos skannaat asiakirjoja, niin muista käyttää riittävää tarkkuutta (300dpi) jotta teksti pysyy tarkkana.

4. Hajauta ja hallitse aineiston tallennus
Säilyttäessä itse ei koskaan saa laittaa kaikkea yhden ratkaisun varaan. Kaikki tallennusmediat ovat alttiita rikkoutumisille. Tallenna siis useille erilaisille tallennusmedioille. Hyviä vaihtoehtoja ovat laadukkaat muistitikut, USB-levyt ja optiset mediat. Älä käytä salausta median suojaamiseen, sillä salaaminen voi estää sen tulevan käytön. Muista hajauttaa tallennusmedioiden säilytys siten, että esimerkiksi tulipalo ei tuhoa niitä. Säilytä vaikka varmuuskopiota työpöydän laatikossa tai pankkiholvissa.

5. Ota yhteyttä ja keskustele aineiston luovuttamisesta Kansallisarkistoon
Voit yksityishenkilönä, perheen tai suvun jäsenenä tai järjestön tai yhdistyksen edustajana mahdollisesti luovuttaa yksityisarkistoaineistoasi Kansallisarkistoon säilytettäväksi. Otamme vastaan hankintapolitiikkaamme mukaista valtakunnallisesti ja alueellisesti merkittäviä aineistoja mm. keskeisiltä poliitikoilta ja yhteiskunnallisilta vaikuttajilta, johtavilta virkamiehiltä, merkittäviltä tutkijoilta ja kulttuurihenkilöiltä, eri sektoreilla vaikuttaneilta suvuilta ja perheiltä, historiallisilta kartanoilta sekä järjestöiltä. Otamme vastaan myös merkittäviä yhteiskuntailmiöitä dokumentoivia arkistoja.

Uusia palveluita tulossa!

 

Vuoden 2019 aikana Kansallisarkisto tulee laajentamaan sähköisen säilyttämisen palvelujaan kattamaan myös yksityisarkistot. Palvelun avulla aineiston siirtäminen, järjestäminen sekä kuvailu tapahtuu helposti verkon kautta.



Teksti: kehittämispäällikkö Markus Merenmies, Kansallisarkisto

Arkistojen päivän Scanathon – tutustumista käsinkirjoitetun tekstintunnistuksen saloihin

Kansallisarkistossa Helsingissä järjestettiin 8.6.2018 kansainvälisen arkistojen päivän kunniaksi Scanathon-tapahtuma yhteistyössä Iso-Britannian ja Sveitsin kansallisarkistojen kanssa. Tapahtumassa tutustuttiin READ-hankkeessa (Recognition and Enrichment of Archival Documents) kehitettyjen ScanTentin ja DocScan-sovelluksen käyttöön ja Transkribus-alustaan.

Kohti Kansallisarkiston asiakirjojen vapaaehtoisdigitointia

Vapaaehtoisuus on nouseva trendi

Kansallisarkisto on päivittämässä digitointistrategiaansa, jossa kahtena keskeisenä tavoitteena on edistää asiakirjallisen kulttuuriperinnön käyttöä digitoimalla asiakaslähtöisesti sekä edistää digitoitujen aineistojen avointa saatavuutta. Samalla Kansallisarkisto on laajentamassa takautuvan digitoinnin toimintatapoja. Digitoinnissa kumppanuusyhteistyö monella eri tavalla on jo arkea.

Yksi uusista toimintatavoista on digitoinnin toteuttaminen vapaaehtoistoiminnan kautta. Vapaaehtoistoiminnan tavoitteena on saada digitoitua tutkimukselle keskeisiä julkisia aineistoja, joiden digitointi aineistojen ominaisuuksien puolesta on hidasta ja Kansallisarkiston omien resurssien ulkopuolella. Vapaaehtoistoiminta ei siis vie yhtään työpaikkaa, mutta mahdollistaa tutkimukselle tärkeiden aineistojen saamisen vapaasti Digitaaliarkiston kautta kaikkien ilmaiskäyttöön avoimen datan periaatteiden mukaisesti.

Vapaaehtoistoimintaa digitoinnissa ja metatietotyössä toteutetaan useissa muissa keskeisissä Kansallisarkistoissa ja monet ovat kehittämässä toimintaa. Esimerkiksi Yhdysvaltain, Tanskan, Viron ja Hollannin Kansallisarkistoissa asiakkaat voivat skannata itseään kiinnostavia asiakirjoja tutkijasalissa olevalla skannerilla myös julkiseen käyttöön laitoksen järjestelmien kautta. Tanskassa vapaaehtoisdigitointia toteutetaan myös antamalla vapaaehtoisten digitoida asiakirjoja Kansallisarkiston laitteilla ja tiloissa. Norjassa ja Iso-Britanniassa osa metatietojen rikastamisesta toteutetaan vapaaehtoisvoimin.

Kansallisarkisto tarjoaa aineistojen käyttäjille mahdollisuuden tulla
mukaan niiden digitointiin. Kuvassa kumppanuusyhteistyömuotoinen
digitointiprojekti digitoimassa alkuperäisiä sidoksia.
Vapaaehtoistoimintaa varten Kansallisarkisto on hankkimassa uusia kamerapöytiä ja kirjahissillä varustettuja kameralaitteistoja, joiden käyttö on nopeaa ja laadun puolesta täyttävät Kansallisarkiston laatukriteerit. Näillä laitteilla digitointi on nopeampaa kuin perinteisillä kirjaskannereilla, ja laite mahdollistaa alkuperäisten aineistojen, myös paksujen sidostenkin digitoinnin kohdetta vaurioittamatta parhaalla mahdollisella teknisellä laadulla.

Kyselyllä suuntaviivoja kehittämiselle

Suunnittelun pohjaksi järjestettiin tammikuun lopulla kysely, jolla selvitettiin ihmisten halukkuutta ja mahdollisuuksia vapaaehtoiseen digitointiin Kansallisarkiston tiloissa. Vastauksia saatiin noin 70 kappaletta.

Kyselyyn vastanneista noin puolet arveli voivansa käydä digitoimassa kerran viikossa tai useammin toisen puolen uskoessa voivansa tehdä työtä harvemmin kuin kerran viikossa. Samoin puolet vastaajista arvioi, että työjakson sopivin kesto olisi enintään muutamia tunteja kerrallaan, kolmannes arvioi voivansa tehdä työtä vähän useammankin tunnin kerrallaan ja hieman harvempi kuin joka viides mietti, että voisi työskennellä kerralla jopa kahdeksan tuntia.

Sopivien aineistojen suhteen monella vastaajalla oli mielessään ajallisia ja alueellisia rajauksia koskien aineistoja, joita he haluaisivat mieluiten digitoida. Uudemmat aineistot kiinnostivat useampaa vastaajaa kuin vanhemmat: itsenäisyyden ajan aineistoista oli kiinnostunut noin 70 % vastaajista, kun Ruotsin ajan aineistojen (vuoteen 1808 saakka) digitointi keräsi noin 50 % kannatuksen.

Tehty kysely ei sitonut vastaajia mihinkään mutta antoi tärkeää ennakkotietoa työjaksojen määrästä ja kestosta sekä vastaajien aineistoihin liittyvistä mieltymyksistä. Suunnittelun edetessä, kevään aikana, on määrä käynnistää vielä toinen kysely, jolla jo etsitään vapaaehtoisia uuden digitointitavan pilotointia varten.

Mitä tehdään seuraavaksi

Kansallisarkisto pyrkii käynnistämään vapaaehtoisdigitoinnin pilotoinnin huhtikuun aikana. Pilotti toteutetaan Helsingissä ja työskentely tapahtuu arkipäivisin klo 8-16. Pilotoinnissa selvitetään vapaaehtoisdigitointiin liittyviä käytänteitä ja pyritään siihen, että kehitettävät toimintatavat ovat mahdollisimman toimivat. Pilottiaineistot on valittu tehdyn kyselyn tulosten pohjalta.

Liikkeelle lähdetään pilottiin osallistuvien vapaaehtoisten valinnan mukaan joko Tilattoman väestön alakomitean tai Suomen Vapaussodan itsenäisyysarkiston materiaalista. Edellinen sisältää kyselykaavakkeet vuonna 1901 suoritetusta maaseudun ruokakuntia koskeneesta tutkimuksesta ja jälkimmäinen on kokoelma vuosiin 1899–1922 liittyviä muistelmatekstejä, joissa kuvataan Suomen itsenäisyyteen johtaneita vaiheita sekä sisällissotaa ja heimosotia. Myös jatkossa päätökset digitoitavasta aineistosta tehdään yhdessä osallistuvien vapaaehtoisten kanssa.

Havainnekuva vapaaehtoiskäyttöön rakennettavasta digitointipöydästä.
Pöytien määrää kasvatetaan niiden käytön lisääntymisen mukaan.
Mitä vapaaehtoisdigitointi voi tuoda tullessaan?

Vapaaehtoisdigitoinnin tärkeimmät edunsaajat ovat arkistoaineistoja käyttävät tutkijat. Jo digitoinnin alkuajoista lähtien on keskusteltu siitä, miten ja missä määrin digitointi vaikuttaa historiantutkimuksen menetelmiin, aihevalintoihin ja tutkimusprosessiin. Tähän saakka digitointi on vaikuttanut lähinnä vain niiden tutkijoiden työhön, joiden käyttämät aineistot ovat olleet digitoitujen joukossa. Aika näyttää, onko historiantutkimuksen uusi normaali se, että tutkijoilta odotetaan käyttämiensä aineistojen digitointia niissä tapauksissa, joissa työmäärä ei ole kohtuuton. Tai näemmekö jatkossa tutkimusprojekteja, joiden suunnittelussa huomioidaan tutkittavan aineiston digitointiin tarvittavat resurssit?

Toiseksi vapaaehtoisdigitoinnista hyötyvät ne kansalaiset, joiden aikataulut mahdollistavat omatoimisen aineistojen digitoinnin. Ajan mittaan esimerkiksi omaa sukua, kotiseutua tai tutkimusaihetta koskevat asiakirjat voi saattaa käytettäväksi ajasta ja paikasta riippumatta.

Lopuksi tulevaisuuden visiota hahmotellessa on syytä nostaa esiin horisontissa jo siintävät uuden teknologian mahdollisuudet, jotka myös vapaaehtoisdigitoitua aineistoa koskevat. Konekirjoitetun tekstin koneellinen tunnistus (OCR) on jo aloitettu ja kaiketi muutamassa vuodessa myös käsinkirjoitetun tekstin koneellinen tunnistus (HTR) saadaan mukaan digitointiprosessiin. Kun nämä tekniikat on saatu osaksi jokapäiväistä toimintaa, lisääntyvät aineistojen käyttömahdollisuudet oleellisesti. Jo yksittäisen tuhatsivuisen tuomiokirjan kattava vapaasanahaku on houkutteleva, mutta entäpä kokonaiseen hyllylliseen tai huoneelliseen aineistoa kohdistuva vapaa sisältöhaku? Tähän suuntaan olemme matkalla.

Tulevaisuus voi siis olla sukututkijoita ja historianopiskelijoita digitoimassa tutkimusaineistojaan ja vanhojen autojen tai lääketieteen historian harrastajia digitoimassa niihin liittyviä asiakirjoja. Tällaisista toiveista saatiin viitteitä jo edellä mainitussa kyselyssä. Myös puhtaita kulttuuritekojen tekijöitä lienee tulevien digitoijien joukossa. Kaikkia tarvitaan, jotta arkistoon tallentunut kulttuuriperintö tulisi yhä useamman saataville. Tällä hetkellä Kansallisarkiston aineistoja on digitoitu 68,6 miljoonaa tiedostoa, mikä on noin 4-5 prosenttia aineistoista. Työsarkaa on vielä runsaasti jäljellä.

Tomi Ahoranta, kehittämispäällikkö
Juho Haavisto, ylitarkastaja
István Kecskeméti, johtaja
Markku Mäenpää, erityisasiantuntija