5.5.2017

Twitter ja digitaalinen säilyttäminen


Sosiaalisen median välineenä Twitter on nopeasti ottanut näkyvän aseman julkisessa keskustelussa ja uutisten nostattajana. Poliittista vaikuttamista, ajankohtaisia ilmiöitä sekä myös korkeiden virkamiesten ajatelmia arkisten havaintojen seassa virtaa miljoonien twiittien päivätahdissa tiivistäen ajankohtaisia teemoja ja synnyttäen lisää sosiaalista keskustelua sosiaalisessa mediassa. Näistä on muodostunut aikakauden viestinnällinen ilmiö, josta muodostuvia aineistoja tarkastelen digitaalisen säilyttämisen näkökulmasta.

Johdantona aiheeseen todettakoon, että Twitter on vuonna 2006 avattu globaali 140 merkin mittaisten viestien, eli twiittien, mikroblogipalvelu. Käyttäjiä on arvioitu olevan 200-300 miljoonaa, joista puolet ei ole koskaan edes lähettänyt yhtään twiittiä, mutta toinen puoli sitäkin aktiivisemmin. Twiittejä oli yhteensä vuoden 2013 raportin mukaan 120 miljardia ja määrä kasvaa noin 500 miljoonaa päivässä, tarkkoja lukuja ei kuitenkaan ole saatavissa. Twitter toiminnallisesti perustuu siihen, että käyttäjät voivat seurata henkilöitä, organisaatioita ja uutislähteitä ja tuottaa vapaasti näitä teemoja käsitteleviä viestejä. Viesteihin voi lisätä eräänlaisia metatietoja viittaamalla näihin tunnuksiin tai lisäämällä viestiin risuaitoja, eli ”Hashtag” avainsanoja.

Voisi ajatella, että tiivis viesti olisi helposti säilytettävissä ja myöhemmin hyödynnettävissä. Mutta kuten digitaalisessa säilyttämisessä yleensäkin, hallitsematon muodostaminen johtaa hankalaan säilyttämiseen.

Haaste 1: kuka säilyttäisi kaikki twiitit?

Sosiaalisen median kaupallisten toimijoiden ansaintalogiikka palvelee mahdollisimman nopeaa ja laajaa tiedon levittämistä. Yhdysvalloissa Kongressin kirjasto teki jo vuonna 2010 yhteistyösopimuksen Twitterin kanssa aineiston luovutuksesta pysyvään säilytykseen. Hanke ei ole kuitenkaan edennyt teknisten haasteiden vuoksi. Aineiston tarjoamista tutkimuksen käyttöön ei ole vieläkään kyetty selvittämään on epäselvää millä ehdoin ja mistä näihin voidaan pääsy järjestää. On kuitenkin hyvä että Twitter on palvelun ylläpitäjänä ymmärtänyt vastuunsa aineiston tarjoajana, säilytyksen vastuun siirtäminen näyttää tosin olleen myös suuren ongelman siirto.

Haaste 2: miten saada haltuun omat twiitit?

Jos tarkastelun näkökulmaksi otetaan arkiston muodostuminen Twitter tarjoaa keinon, jolla käyttäjä voi noutaa omat twiittinsä ”pyydä arkistosi” toiminnon kautta ja huolehtia näin itse säilyttämisestä. Arkistopaketti sisältää sekä twiitit, että työkalut, joilla paketin sisältöä voi selailla ja tehdä jopa hakuja. On toki hieman avoin kysymys se, että miten nämä toiminnallisuudet aidosti säilyvät. Säilyttävän tahon vastuulle jää huolehtia aikanaan näiden migroinnista tai verkkoympäristön emuloinnista.

Haaste 3: Miten twiittejä voisi hyödyntää tutkimuksessa?

Välineenä twitter on ketterä, monimuotoinen ja twiittaaminen on vaikeasti kontrolloitavissa. Tämä yhdistelmä on ollut merkittävässä roolissa erilaisten vastarintaliikkeiden ja kansannousujen yhteydessä. Onkin esitetty että Twitter oli vuoden 2011 arabikeväässä merkittävässä roolissa tiedon välittämiseksi sekä maan sisällä, että erityisesti kansainvälisesti.

Tutkimuksen kannalta Twiitti on helposti säilyvä tekstimuotoinen kokonaisuus, joka muodostuu itse sisällöstä ja mm. aikaleimoista. Twiittien hyödyntämiseen liittyy haasteita, jotka johtuvat enemmän twiittien sisällöstä. Sosiaalinen media on verkottuvaa ja keskustelevaa ja twiitissä voidaan linkittää ja kommentoida facebook kirjoitusta joka liittyy Youtube-kanavalla olevaan videoon. Jos ketju katkeaa, ei säilyttäminen kannata. Kokonaisuus on herkkä ja rakentuu epävarmojen suhteiden varaan. Sosiaalisen median aineisto muodostaa päättymättömän jatkumon ja kokonaisuuden hahmottamiseksi tulisi kyetä yhdistämään suurempi joukko teemaa käsitteleviä viestejä yhdeksi kokonaisuudeksi. Tämä edellyttäisi että tutkijalla tulisi olla pääsy kaikkiin twiitteihin, ei yksinomaan määrätyn toimijan itse lähettämiin. Haravoinnissa voidaan hyödyntää #hashtag rajauksia sekä maantieteellisiä elementtejä, mutta nämä(kin) saattavat antaa hyvin puutteellisen kuvan aiheen käsittelystä. Twiiittien tägääminen, eli merkkaaminen, on vapaamuotoista ja voi sisältää koordinaation puutteen vuoksi myös täysin ristiriitaisia linkityksiä. Tässä hetkessä ajankohtaisen ilmiön hastag voi yllättäen olla sama kuin korealaisen rock-yhtyeen nimi, mikä johtaa vähintään mielenkiintoisiin yhdistelmiin.

Twiittien avulla nostetaan esille ja kommentoidaan verkossa olevaa aineistoa, uutispalvelut suorastaan houkuttelevat tähän. Koska Twiitti on lyhyt, vain 140 merkkiä, on käyttöön yleistyneet erilaiset lyhennystyökalut (BitLy, TinyUrl), joilla voidaan näin kolmannen osapuolen avulla tulkita ja välittää viestejä. Niin käytännöllisiä kuin nämä palvelut ovatkin, ei niiden jatkuvuudesta ole takeita. Twiittien säilyttämisen yhteydessä nämä kutistetut linkitykset tulee automaattisesti avata. Tämä ei tietenkään poista sitä ongelmaa, että jo parissa vuodessa noin 80% viittauksen kohteista on joko muuttunut tai kokonaan kadonnut. Säilyttämisen yhteydessä tämä linkkiviittaus tulisi muuttaa osoittamaan verkkoarkistossa olevaan ilmentymään. Mikä tarkoittaisi että verkkosivut ja twiitit pitäisi saada säilymään mahdollisimman tuoreina.

Yhteenvedoksi

Tutkimuksen kannalta koko twiittimassan tutkiminen antaa vielä odottaa ratkaisuaan. Tässä teknologian kehittyminen ja aineiston massiivinen kertyminen käyvät kilpajuoksua keskenään. Säilyttämisen suhteen tulisikin toimia proaktiivisesti ja aineisto ottaa talteen jo muodostamisen yhteydessä. Muuntamalla linkitykset verkkoarkistoihin osoittavaksi voidaan varmistaa sisällön ymmärrettävyys. Vastuiden jaon kannalta olisi tärkeää että twiittaajat toimimat itse aktiivisesti ja ottamalla talteen sekä omaa että mahdollisesti itseen kohdentuvia twiittejä. Vastaavasti kansallisten toimijoiden tulee tarjota opastusta erilaisten työkalujen käyttöön mm. verkkoarkistoihin liittyen.

Twiittien pysyvään säilyttämiseen tutkimuksen tarpeisiin ei siis vielä ratkaisuja ole, mutta ongelma on onneksi monimuotoisuudessaan tiedostettu. Aihealueena julkisen toimijan twiittaukset ovat mielenkiintoinen ja merkittävä kokonaisuus, jossa Kansallisarkiston vastuu viranomaisen toiminnan dokumentaation säilyttämisestä kohtaa Kansalliskirjaston vastuun verkkoarkistojen säilymisestä.

Allekirjoittanutta voi seurata Twitterissä tunnuksen @MarkusMerenmies ja Kansallisarkiston viestejä tunnuksen @Kansallisarkist kautta.

Markus Merenmies
Kehittämispäällikkö
Kansallisarkisto

@MarkusMerenmies

Ei kommentteja:

Lähetä kommentti

Kiitos kommentistasi. Viesti ilmestyy näkyviin heti kun ylläpito on ehtinyt tarkastaa sen.