Volgan alueen kielten tutkimusyksikössä on sähköisten kielikorpusten kokoelma, jota kehitetään mahdollisuuksien mukaan. Tulevaisuudessa aineistot ovat käytettävissä kieli- ja käännöstieteiden laitoksen yhteisen aineistoportaalin kautta.
Toistaiseksi aineistoja käyttämään haluavien on pyydettävä käyttöoikeutta projektikoordinaattorilta lähettämällä viesti osoitteeseen volgaserver@utu.fi. Käyttöoikeuksia myönnetään korkeakoulujen ja tutkimuslaitosten tutkijoille ja opiskelijoille.
Eri kielten sanalistoja aineistokseen tarvitseva saa ne kuitenkin suoraan käyttöönsä Suomalais-Ugrilaisen Seuran verkkosivustolta.
Aineistot jakaantuvat seuraaviin luokkiin:
- annotoimattomat tekstit (pelkkiä tekstejä ilman kieliopillista analyysia)
- kieliopillisesti annotoidut tekstit (kaikki sanat analysoitu morfologisesti)
- paralleelitekstit (sama teksti monella kielellä)
- kirjakielen historian korpukset (valikoima tekstejä eri vuosikymmeniltä)
- sanaluettelot (sanat luokiteltuina sanaluokkiin, ei merkityksen selityksiä)
Aineistot kielittäin
Mari
- annotoimattomia tekstejä (enimmäkseen niittymaria)
- niittymarin kirjakielen historian korpus (eri vuosikymmenten tekstejä vuodesta 1909 vuoteen 2008)
- paralleelitekstit: nuorisoromaani (niitty- ja vuorimari), Suomi-tietokirja (niittymari)
- sanaluettelo, jossa sekä niitty- että vuorimarin sanastoa
Mordva
- annotoimattomia tekstejä (ersä ja mokša)
- morfologisesti annotoituja tekstejä (ersä ja mokša)
- kirjakielen historian korpus (eri vuosikymmenten tekstejä vuodesta 1920 vuoteen 2008; sekä ersä että mokša)
- paralleelitekstit: nuorisoromaani ja Suomi-tietokirja (kumpikin ersäksi ja mokšaksi)
- sanaluettelo, jossa sekä ersän että mokšan sanastoa
Udmurtti
- annotoimattomia tekstejä
- paralleelitekstit: nuorisoromaani ja Suomi-tietokirja
- sanaluettelo
Komi
- annotoimattomia komipermjakin tekstejä
- paralleelitekstit: nuorisoromaani (komi ja komipermjakki) ja Suomi-tietokirja (komi)
- sanaluettelo (komi)
Tšuvassi
- annotoimattomia tekstejä
- paralleelitekstit: nuorisoromaani
- sanaluettelo
Tataari
- annotoimattomia tekstejä
- paralleeliteksti: nuorisoromaani
- sanaluettelo
Muut kielet
- paralleelitekstit: nuorisoromaani (suomi, hanti, mansi, unkari, venäjä), Suomi-tietokirja (suomi, venäjä)