Det er derfor en en formidabel mengde data det er snakk om å organisere. De som skal gjøre jobben er The Library of Congress i USA. De skriver (i følge et oppslag på C-net):
"Twitter is a new kind of collection for the Library of Congress but an important one to its mission. As society turns to social media as a primary method of communication and creative expression, social media is supplementing, and in some cases supplanting, letters, journals, serial publications, and other sources routinely collected by research libraries."
I følge Fast Company har Library of Congress en avtale fra 2010 med Twitter om å få adgang til historiske tweets. Den gang var det bare sendt 21 milliarder tweets i hele Twitters levetid siden 2006, men nå har Library of Congress fått overført 150 milliarder nye tweets som er sent siden 2010. Og veksttakten øker stadig.
Diskene som inneholder de to kopiene av alle disse meldingene tar 133 terrabytes med plass. Plassen er faktisk ikke det største problemet, for oppdateringer på Twitter består av tekst og er på maks 140 tegn. Problemet er å gjøre databasen tilgjengelig og søkbar på en fornuftig måte, slik at man kan bruke den til noe praktisk. Fast Company beskriver utfordringen slik:
Library of Congress følger med i tiden, noe de også viser gjennom å ha en egen blogg der de skriver om aktuelle prosjekter de jobber med. På bloggen kan man også finne informasjon om det store Twitter-prosjektet.
Ingen kommentarer :
Legg inn en kommentar