mandag 9. mars 2020

Små språk på store plattformer

Er det slik at de små språkene i verden taper terreng når de store programvareselskapene, PC- og mobilprodusentene og sosiale medieplattformene blir stadig større? Og at selv norsk risikerer å tape terreng når engelsk dominerer stadig mer?

Eller er det tvert imot slik at disse store plattformene utvider verktøykassen, senker kostnadene og gir noen helt nye muligheter for verdens små språk og urfolksspråk? Blant annet ved at det er mulig å koble til og bruke ordbøker, stavekontroller, læringsverktøy og oversettelsesprogrammer. Verktøy som gjør at flere enn før kan lære og bruke disse språkene i hverdagen.

Og det enkle svaret er at om det blir lettere eller vanskeligere for små språk er helt avhengig av i hvor stor grad de store plattformene åpner opp slik at andre kan koble til ulike språkverktøy og hjelpemidler. Som tastatur med andre tegnsett, ordbøker og stavekontroller. Det er lite sannsynlig at de store plattformgigantene selv kan eller vil utvikle hele denne verktøykassen for alle verdens små språk. Men det er ikke så farlig dersom de gjør det mulig for å andre leverandører å slippe til med produktene sine.

For å lære mer om dette dro jeg på mandag til Universitetet i Tromsø sammen med sametingsråd Henrik Olsen og min statssekretærkollega Anne Karin Olli i KMD, med ansvar for samepolitikk og nasjonale minoriteter, for å lære mer om muligheter og utfordringer når det gjelder bruk av språkverktøy og språkteknologi. Vi besøkte to små, men internasjonalt ledende forskingsgrupper på universitetet som kombinerer forskningen på språkteknologi for urfolksspråk med utviklingen av konkrete verktøy som folk som bruker et av de samiske språkene i det daglige kan benytte seg av.

Giellatekno er forskningsgruppen for samisk språkteknologi. På nettsiden kan man finne ordbøker og andre språkverktøy ikke bare for de samiske språkene, men også for flere andre små språk i verden. Leder for denne gruppen er Trond Trosterud. De er samlokalisert med Divvun som er ledet av Sjur Moshagen og er et senter for utvikling av språkverktøy for samisk. På nettsiden finner man blant annet sofware-tastaturer med samiske tegn. retteprogrammer, ordbøker, tekst til taleprogrammer og oversettelsesprogrammer.

Det aller siste de har lansert er verdens første gramatikkontroll for samisk, en sak som er omtalt på nettsidene til Universitetet også, der de skriver:

"– Dette er jo en aldri så liten begivenhet. Etter det vi kjenner til er GramDivvun også den første grammatikkontrollen noensinne for et urfolkspråk, sier Moshagen. En stavekontroll for de samiske språkene nord-, sør-, lule-, enare- og skoltesamisk har allerede vært i bruk en stund. Grammatikkontrollen som nå er offisielt lansert, er foreløpig kun for nordsamisk."

Og litt mer generelt om betydningen av disse språkmiljøene som kombinerer forskning med utvikling av verktøy som kan anvendes i det daglige, skriver nettsiden at:

"UiT-miljøer som Giellatekno og Divvun har i flere år stått i front i det som beskrives som en digital språkrevolusjon for verdens urfolkspråk. Blant mange milepæler for miljøene er utvikling av samisk tastatur for mobiltelefoner og nettbrett som ble lansert i 2014 og som fungerer som en portåpner til blant annet sosiale medier. Til grunn lå teknologi som gjorde det enkelt å lage skjermtastaturer til alle slags skriftspråk."


Dette med digitale plattformer som ikke bare er laget for et språk, men har funksjonalitet som kan brukes for mange av verdens små språk, er spennende. Det gjør at Norge også kan spille en internasjonal rolle på dette området dersom vi har noe å komme med som resten av verden trenger. Og dette er jo noe av bakgrunnen for opplaget om disse to miljøene ved universitetet i Tromsø, der bildet nettopp er fra FN i New York, der forskerne fra Tromsø diskuterer hvordan de kan hjelpe andre som har behov for ulike språkteknologiske verktøy:

"Divvun 1.0 stavekontroll ble lansert allerede i 2007. Den aller første nordsamiske stavekontrollen inneholdt cirka 70.000 ord. I 2015 ble det sluppet en gratis tilgjengelig versjon som ikke bare inneholdt dobbelt så mange ord, men også en oppdatert rettskriving. Den største nyvinningen var likevel måten stavekontrollen ble laget på. Ved å bruke åpne kildekoder åpnet man for at de aller fleste skriftspråkene i verden kunne få sin egen stavekontroll. Det samme gjelder for den nå helt ferske grammatikkontrollen. – Det tekniske rammeverket er språkuavhengig og kan i prinsippet brukes av hvilket som helst språk i verden, sier Sjur Nørstebø Moshagen."

Ingen kommentarer :

Legg inn en kommentar