Sampo
Pyysalo
yliopistotutkija, data-analytiikka
Ota yhteyttä
Julkaisut
Scaling Data-Constrained Language Models (2023)
Conference on Neural Information Processing Systems, Advances in Neural Information Processing Systems
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa)
The STRING database in 2023: protein-protein association networks and functional enrichment analyses for any sequenced genome of interest (2023)
Nucleic Acids Research
(Vertaisarvioitu alkuperäisartikkeli tai data-artikkeli tieteellisessä aikakauslehdessä (A1))
Multi-CrossRE A Multi-Lingual Multi-Domain Dataset for Relation Extraction (2023)
Nordic Conference on Computational Linguistics, NEALT proceedings series
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
Overview of DrugProt task at BioCreative VII: data and methods for large-scale text mining and knowledge graph generation of heterogenous chemical-protein relations (2023)
Database: The Journal of Biological Databases and Curation
(Vertaisarvioitu alkuperäisartikkeli tai data-artikkeli tieteellisessä aikakauslehdessä (A1))
Silver Syntax Pre-training for Cross-Domain Relation Extraction (2023)
Findings of the Association for Computational Linguistics
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
Toxicity Detection in Finnish Using Machine Translation (2023)
Nordic Conference on Computational Linguistics, NEALT proceedings series
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
Kohti suomenkielisiä keskustelumalleja: tule kehittämään tekoälyä (2023)
Hiiskuttua: Turun yliopiston humanistisen tiedekunnan verkkolehti
(Artikkeli ammattilehdessä tai kirjoitus ammatillisessa blogissa (D1))
FinGPT: Large Generative Models for a Small Language (2023)
Conference on Empirical Methods in Natural Language Processing
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
Towards better structured and less noisy Web data: Oscar with Register annotations (2022)
International Conference on Computational Linguistics, International Conference on Computational Linguistics
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
Register identification from the unrestricted open Web using the Corpus of Online Registers of English (2022)
Language Resources and Evaluation
(Vertaisarvioitu alkuperäisartikkeli tai data-artikkeli tieteellisessä aikakauslehdessä (A1))