Neuroverkkokääntäminen – vastaus kieltenvälisiin ongelmiin?

17.11.2017

Vuosikymmenten ajan konekääntämisestä on povattu korvaajaa ihmiselle, mutta ainakaan vielä tavoitetta ei ole saavutettu. Neuroverkkokääntäminen (Neural Machine Translation, NMT) on uudempi edistysaskel konekääntämisessä, ja sille on asetettu suuria odotuksia. Turun yliopiston kieli- ja käännöstieteiden laitos järjestää kääntäjäopiskelijoille konekääntämisen ja käännösteknologian kursseja, joissa korostuu käytännön tutustuminen nykyteknologiaan. Neuroverkkokääntimiä markkinoidaankin mediassa kieltenvälisten ongelmien ratkaisijana, mutta miten asian laita on pinnan alla?

– Neuroverkkokääntimet toimivat niin, että ne itse ”oppivat” kieliparin välisen käännetyn materiaalin avulla tekemään käännöksiä, kertoo käännösteknologian opettaja ja tutkija, yliopistonlehtori Maarit Koponen. Kyseessä on siis tekoäly, joka valmiiden algoritmien avulla oppii sille syötetystä materiaalista kääntämään kahden kielen välillä. Ihminen ei pysty täysivaltaisesti vaikuttamaan kääntimen oppimisprosessiin, mikä luo omat haasteensa kääntimen kehittämiselle. Koponen toteaa, että käännin saattaakin oppia materiaalin pohjalta käännöksiä väärin, eikä edes sen kehittäjä pysty tehokkaasti korjaamaan virheitä.

Neuroverkkokääntäminen on kuitenkin esitetty viime aikoina julkisuudessa välineenä, joka tulee ratkaisemaan kieltenväliset ongelmat lähes kokonaan. Esimerkiksi Facebook, Google ja Microsoft käyttävät NMT:tä ja ajavat sitä voimakkaasti eteenpäin. Konekääntäminen on kehittynyt viime vuosikymmenten aikana paljon, mutta se toimii edelleen parhaiten rajatun aiheen sisällä.

Käännökset ovat parantuneet, mutta kehitettävää riittää

– Esimerkiksi säätiedotuksia on jo vuosikymmeniä pystytty käännättämään koneella, sillä sanasto ja aihealueet pysyvät samanlaisina vuodesta toiseen. Neuroverkkokääntäminen ei ole ottanut kuitenkaan niin suurta askelta eteenpäin kuin mainonnan perusteella voisi uskoa, ja tämäkin käännin toimii yhä parhaiten rajatussa ympäristössä, Koponen kertoo.

Teknologian puolesta NMT:llä pystyisi kääntämään useiden eri alojen tekstejä, mutta opetusmateriaalin sisältö määrittää yksittäisen koneen soveltuvuuden. Luotettavimpia käännöksiä saadaan siis silloin, kun opetusmateriaalin sisältö vastaa käännätettäviä tekstejä.

Luotettavuus onkin tärkeä näkökulma konekääntämisessä, sillä NMT muistuttaa huomattavan paljon, joskus lähes täydellisesti, ihmisen kirjoittamaa tekstiä. Koponen esittääkin tämän olevan sekä kääntimen vahvuus että heikkous, sillä vaikka teksti olisikin virheettömän näköistä, voi itse asiasisällössä olla suuriakin virheitä. Ihmiskääntäjän rooli on tärkeä käännöksen tarkistamisessa ja jälkieditoinnissa, eli NMT:n käännöksiin tulee suhtautua kriittisellä mielellä ja katsoa pintaa syvemmälle, hän jatkaa.

– Neuroverkkokäännin tarvitsee paljon tekstimateriaalia kielipareista oppiakseen kääntämään niitä, ja materiaalin riittämättömyys onkin yksi kääntimen kehittämisen haasteista. Tässä vaiheessa eniten käännettyjä tekstejä löytyy yleensä englanniksi, eli toisen kielen on lähes aina oltava englanti, jotta kääntimellä on tarpeeksi oppimismateriaalia sujuvia käännöksiä varten, Koponen lisää.

Neuroverkkokääntämisellä on paljon potentiaalia, mutta myös huomioon otettavia puutteita. Missä NMT:n tulevaisuus voisi siis olla? Kääntimeltä ei kannata odottaa kokonaisten tietokirjojen kääntämistä kieleltä toiselle, vaan sen käyttötarkoitukset ovat ennemminkin interaktiivisia. Koponen toteaa, että käännin todennäköisesti toimisi parhaiten ihmiskääntäjän apuvälineenä, tai esimerkiksi apuna tiedonhaussa, kunhan käännösten luotettavuutta osataan arvioida. NMT voisi olla hyödyksi myös selkeän ja rajatun kontekstin tilanteissa, kuten terveydenhuollon kieliongelmien selvittämisessä.

Koponen kertoo konekääntämisen opettamisen yliopistolla tähtäävän tulevaisuuteen, sillä kääntäjäopiskelijat tulevat hyvin todennäköisesti käyttämään ja tarvitsemaan teknologiaa työssään. Kurssilta saadaan perustiedot konekääntämisestä ja opiskelijat pystyvät arvioimaan konekääntämisen käyttökelpoisuutta ja soveltuvuutta, sekä kommunikoimaan samat asiat myös asiakkailleen.

– Tulevaisuutta on kuitenkin vaikea ennustaa, sillä konekääntäminen on kehittynyt muun teknologian mukana joskus harppauksin, joskus taas hitaammin. Tulevilla kääntäjillä riittää töitä jatkossakin, mutta teknologia on yhä vahvemmin osana työnkuvaa. Tällä hetkellä vaikuttaa siltä, että neuroverkkokääntimillä on vahva sija osana tulevaisuuden teknologiaa, Koponen ennustaa.

Jenni Maja

Luotu 17.11.2017 | Muokattu 17.11.2017

Asiasanat

viestintä