Hanna-Mari Kupari profiilikuva
Hanna-Mari
Kupari
väitöskirjatutkija, digitaalinen kielentutkimus, espanja, italia, kiina, ranska, saksa
filosofian maisteri - Master of Arts
Keskiajan latinan tutkimus korpuslingvistiikan metodeilla

Ota yhteyttä

Arcanuminkuja 1
20500
Turku

Asiantuntijuusalueet

Keskiajan latina
korpuslingvistiikka
TEI-xml
automaattinen morfosyntaktinen jäsentäminen

Biografia

Olen digitaalisen kielentutkimuksen väitöskirjatutkija Turun yliopistossa Emil Aaltosen säätiön rahoituksella. Yhdistän työssäni keskiaikaiset aineistot uusimpiin nykyaikasiin koneoppimismallintamisen menetelmiin. Maisterin tutkintoni olen suorittanut klassillisesta filologiasta pääaineenani latinalainen filologia. Erityisesti olen kiinnostunut kieliopin tutkimuksesta, määrällisistä menetelmistä ja paikallishistorian näkökulmista.

Olen kiinnostunut tiedeviestinnästä ja toiminut Hiiskuttua verkkojulkaisun apulaispäätoimittajana.

Tohtoriverkosto ry:ssä olen ollut aktiivinen jäsen jo muutaman vuoden ajan.




Opetus

Opetuskokemus

Tarton yliopisto, Viro

  • Käytännön työpaja: Automatic morpho-syntactic annotation of large language corpora using the Universal Dependencies framework (kevät 2024). Viiden tapaamisen työpaja opiskelijoille ja henkilökunnalle, jossa käsiteltiin teoriaa, terminologiaa, jäsennystyökaluja ja käytännön puupankkien luomista.
  • Luento Digital Resources -kurssilla klassillisessa filologiassa: Treebanks and automatic linguistic annotation for Classical Languages (kevät 2024).


Turun yliopisto, Suomi


  • Digital Interaction -luentosarja (kevät 2024): Yksi luento: Tietokoneavusteiset menetelmät kieliopin jäsentämiseen.
  • Korpuslingvistiikka ja kieliteknologia (syksy 2023, viisi luento ja 2024, kuusi luentoa): Aiheina opiskelijaprojektit, eettiset kysymykset ja suurten kielimallien käyttö, automaattinen nimientunnistus, sentimenttianalyysi, automaattinen morfosyntaktinen jäsennys, kielen esittäminen vektoreina sekä ohjattu ja ohjaamaton koneoppiminen.
  • Linguistic Landscapes -kurssilla yksi luento (kevät 2023). Historiallisten kirjallisten lähteiden näkökulmia kielimaisemiin Turussa, yhdessä professori Marko Lambergin kanssa.


Tutkimus

Nykyaikaiset menetelmät keskiaikaisille lähteille

Väitöskirjassani, joka kuuluu digitaalisten ihmistieteiden alaan, tutkin keskiaikaisia apostolisia rikosoikeudellisia penitentiariaattiasiakirjoja sekä Registrum Ecclesiae Aboensiksen kopiokirjaa hyödyntäen korpuslingvistiikan menetelmiä. Tutkimukseni keskiössä on keskiajan latinan kielenkäyttö ja kielellinen vaihtelu (rekisterianalyysi), jota tarkastelen metatiedoilla täydennettyjen ja morfosyntaktisesti annotoitujen tekstikorpusten avulla. Edistän avointa tiedettä julkaisemalla kaiken käyttämäni koodin, datan ja tutkimustulokset avoimesti julkaisujeni rinnalla.

Toimin TurkuNLP- ja TUCEMEMS-tutkimusryhmien jäsenenä.

Apurahat

Tutkimustyölleni ole saanut tukea Emil Aaltosen säätiön apurahasta (2022–2024), Turun Yliopistosäätiön matka-apurahasta (2023), Turun yliopiston tutkimusapurahoista (2022, 2021), Suomen Kulttuurirahaston Varsinais-Suomen aluerahaston apurahasta (2021) sekä Uskelan Opintorahastosäätiön apurahasta (2020). Lisäksi olen saanut Turun Yliopistosäätiön Villa Tammekann -apurahoja tutkimusvierailuihin Tarttoon, Viroon (2023, 2024).

Vuonna 2024 minulle myönnettiin Otto A. Malmin liikkuvuusapuraha sekä Kordelinin säätiön päätoiminen työskentelyapuraha. Tammikuussa ja joulukuussa 2024 työskentelin Suomen Rooman-instituutissa, jossa vierailin penitentiariaattiarkistossa ja kirjastoissa. Saman vuoden syksyllä olin tutkimusvierailulla Harvardin yliopiston historian laitoksella perehtymässä digitaalisten menetelmien käyttöön. Vuodelle 2025 minulle myönnettiin Villa Lanten ystävät - Villa Lantes vänner ry. apuraha.

Julkaisut

Järjestä:

Avoin tiede ja tutkimusinfra (2024)

Hiiskuttua: Turun yliopiston humanistisen tiedekunnan verkkolehti
Kupari, Hanna-Mari; Leinonen, Päivi
(D1 Artikkeli ammattilehdessä)

FinGPT: Large Generative Models for a Small Language (2023)

Conference on Empirical Methods in Natural Language Processing
Luukkonen Risto, Komulainen Ville, Luoma Jouni, Eskelinen Anni, Kanerva Jenna, Kupari Hanna-Mari, Ginter Filip, Laippala Veronika, Muennighoff Niklas, Piktus Aleksandra, Wang Thomas, Tazi Nouamane, Scao Le Teven, Wolf Thomas, Suominen Osma, Sairanen Samuli, Merioksa Mikko, Heinonen Jyrki, Vahtola Aija, Antao Samuel, Pyysalo Sampo
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))