Veronika
Laippala
Professor, Digital Language Studies, Chinese, French, German, Italian, Spanish
Areas of expertise
Computational linguistics
text linguistics
corpus linguistics
digital discourse analysis.
Biography
I am a linguist who likes computers. My main research topics include language variation across different communicative situations and the development of automatic tools so that we could better benefit from large, web-crawled corpora.
My ongoing projects include "A piece of news, an opinion or something else? Different texts and their detection from the multilingual Internet" funded by Emil Aaltonen foundation and "Massively multilingual modeling of registers in web-scale data" funded by Academy of Finland.
For more information, please have a look at our lab website at https://turkunlp.github.io/
Publications
Automated Emotion Annotation of Finnish Parliamentary Speeches Using GPT-4 (2024)
ParlaCLARIN Workshop, LREC Proceedings
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa)
In search of founding era registers: automatic modeling of registers from the corpus of Founding Era American English (2023)
Digital Scholarship in the Humanities
(A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä )
Helsingin kielilukion vierailu uusiin Arcanumin tiloihin (2023)
Leala-tutkimuskeskuksen blogi
(Artikkeli ammattilehdessä tai kirjoitus ammatillisessa blogissa (D1))
FinGPT: Large Generative Models for a Small Language (2023)
Conference on Empirical Methods in Natural Language Processing
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
Analyzing the unrestricted web: The finnish corpus of online registers (2023)
Nordic Journal of Linguistics
(A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä )
Predictive keywords: Using machine learning to explain document characteristics (2023)
Frontiers in Artificial Intelligence
(Vertaisarvioitu alkuperäisartikkeli tai data-artikkeli tieteellisessä aikakauslehdessä (A1))
Toxicity Detection in Finnish Using Machine Translation (2023)
Nordic Conference on Computational Linguistics, NEALT proceedings series
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
Towards better structured and less noisy Web data: Oscar with Register annotations (2022)
International Conference on Computational Linguistics, International Conference on Computational Linguistics
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
Explaining Classes through Stable Word Attributions (2022)
Annual Meeting of the Association for Computational Linguistics, Annual Meeting of the Association for Computational Linguistics
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
Etäyhteyksistä paluu normaaliin arkeen: yliopistovierailu kampuksella (2022)
Leala-tutkimuskeskuksen blogi
(Artikkeli ammattilehdessä tai kirjoitus ammatillisessa blogissa (D1))