Valtteri
Skantsi
historia ja arkeologia
Ota yhteyttä
Julkaisut
Towards diverse and contextually anchored paraphrase modeling: A dataset and baselines for Finnish (2023)
Natural Language Engineering
(Vertaisarvioitu alkuperäisartikkeli tai data-artikkeli tieteellisessä aikakauslehdessä (A1))
Analyzing the unrestricted web: The finnish corpus of online registers (2023)
Nordic Journal of Linguistics
(A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä )
Towards better structured and less noisy Web data: Oscar with Register annotations (2022)
International Conference on Computational Linguistics, International Conference on Computational Linguistics
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
Beyond the English web: Zero-shot cross-lingual and lightweight monolingual classification of registers (2021)
European Chapter of the Association for Computational Linguistics
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
Multilingual and Zero-Shot is Closing in on Monolingual Web Register Classification (2021)
Nordic Conference on Computational Linguistics, Linköping Electronic Conference Proceedings
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
Finnish Paraphrase Corpus (2021)
Nordic Conference on Computational Linguistics, Linköping Electronic Conference Proceedings
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
From Web Crawl to Clean Register-Annotated Corpora (2020)
Web as Corpus Workshop
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))