Uudella kielten rakenteita kuvaavalla mallilla voidaan luoda entistä tarkempia kielenkäännösohjelmia (Väitös: MSc Mikhail Barash, 25.9.2015, diskreetti matematiikka)
MSc Mikhail Barash tutkii väitöskirjassaan miten kielten syntaksia voidaan määritellä, oli kyseessä sitten luonnollinen tai keinotekoinen kieli, kuten ohjelmointikieli. Barashin kehittämä kielioppimalli mahdollistaa tietokoneohjelmalle erittäin nopean analyysin, mistä voi olla hyötyä kielenkäännösohjelmien kehityksessä.
Turun yliopiston tiedote 17.9.2015
Kielten syntaksia määritellään formaalisilla kieliopeilla, joista yhtä lajia, niin kutsuttua konteksteilla varustettua kielioppia, Barash kehitti väitöstutkimuksessaan.
Yksi tärkeimmistä vaatimuksista käytännön näkökannalta on, että tietokoneohjelma pystyy analysoimaan materiaalin nopeasti.
– Esitän väitöskirjassani kielioppimallin, joka mahdollistaa täydellisen ohjelmointikielten kuvauksen sekä nopean ja tietyissä tapauksissa erittäin nopean analyysin. Täydellisen kielen kuvauksen ja nopean analyysin mahdollistavan mallin avulla voitaisiin kehittää esimerkiksi nykyistä tarkempia kielenkäännösohjelmia, Barash toteaa.
Lauseen rakennetta koskevaa tietoa käytetään automaattisessa kääntämisessä
Formaalisten kielioppien tutkimuksen aloitti amerikkalainen kielentutkija Noam Chomsky jo 1950-luvulla, kun hän tutki miten luonnollisia kieliä voidaan kuvailla.
Chomskyn kehittämää kielioppimallia käytetään ei ainoastaan kielitieteen sovelluksissa, vaan myös tietojenkäsittelytieteessä ohjelmointikieliä kuvattaessa. Nykyään kielioppimalleja voidaan käyttää jopa DNA:n rakennetta kuvattaessa, koska DNA:n rakenne voidaan ymmärtää neljän aminohapon symbolien sekvenssinä.
Niin kutsuttu Chomskyn kielioppi koostuu lauserakennesäännöistä, kuten esimerkiksi siitä, että lause koostuu substantiiviosiosta, jota seuraa verbiosio. Samaa periaatetta voidaan käyttää myös substantiiviosiosta jakautuen substantiiviin ja sen määritteisiin ja siten määrittää useita eri kerroksia kielessä. Sen lisäksi hienostuneimmatkin lauserakenteet voidaan määrittää formaalisesti ja siten saada lauseen täydellinen rakenne selvitettyä.
– Tätä lauseen rakennetta koskevaa tietoa voitaisiin käyttää avuksi automaattisessa kääntämisessä yhdestä kielestä toiseen, riippumatta siitä, ovatko kielten rakenteet samanlaisia tai toisestaan poikkeavia, kertoo Barash tutkimuskohteensa hyödyntämismahdollisuuksista.
Chomskyn kehittäessä oman teoriansa hänellä oli jatkoajatus siitä, että joitakin sääntöjä voidaan käyttää ainoastaan tietyissä yhteyksissä. Chomskyn malli on yhä johtava, siitäkin huolimatta että se ei ole kaikenkattava ja ohjelmointikielet joudutaan kuvaamaan myös muita keinoja käyttäen.
– Chomskyn yrittäessä viedä tätä ajatusta eteenpäin sen soveltaminen käytännössä osoittautui mahdottomaksi. Väitöskirjassani tarkastelen Chomskyn ajatusta uudelta logiikan näkökannalta. Väitöskirjassani esitetty kielioppimalli mahdollistaa täydellisen ohjelmointikielten kuvauksen, Barash kertoo.
**
Perjantaina 25. syyskuuta 2015 kello 12 esitetään Turun yliopistossa (Publicum, Pub3-auditorio, Assistentinkatu 7, Turku) julkisesti tarkastettavaksi Master of Science Mikhail Barashin väitöskirja ”Defining contexts in context-free grammars” (Kontekstien antaminen kontekstittomille kieliopeille). Virallisena vastaväittäjänä toimii professori Frank Drewes Uumajan yliopistosta Ruotsista ja kustoksena dosentti Alexander Okhotin Turun yliopistosta.
MSc Mikhail Barash on syntynyt vuonna 1990 Irkutskissa Venäjällä ja kirjoittanut siellä ylioppilaaksi 2006. Master of Science -tutkinnon hän suoritti 2011 Irkutskin valtion yliopistossa. Väitös kuuluu diskreetin matematiikan alaan.