Valtteri
Skantsi
School of Languages and Translation Studies
Project Researcher, School of Languages and Translation Studies
History and Archaelogy
Contact
Publications
Towards diverse and contextually anchored paraphrase modeling: A dataset and baselines for Finnish (2023)
Natural Language Engineering
(Vertaisarvioitu alkuperäisartikkeli tai data-artikkeli tieteellisessä aikakauslehdessä (A1))
Analyzing the unrestricted web: The finnish corpus of online registers (2023)
Nordic Journal of Linguistics
(A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä )
Towards better structured and less noisy Web data: Oscar with Register annotations (2022)
International Conference on Computational Linguistics, International Conference on Computational Linguistics
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
Beyond the English web: Zero-shot cross-lingual and lightweight monolingual classification of registers (2021)
European Chapter of the Association for Computational Linguistics
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
Multilingual and Zero-Shot is Closing in on Monolingual Web Register Classification (2021)
Nordic Conference on Computational Linguistics, Linköping Electronic Conference Proceedings
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
Finnish Paraphrase Corpus (2021)
Nordic Conference on Computational Linguistics, Linköping Electronic Conference Proceedings
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
From Web Crawl to Clean Register-Annotated Corpora (2020)
Web as Corpus Workshop
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))