Lauseopin arkisto
Lauseopin arkisto on atk-muotoinen tekstikorpus, joka koostuu kaikkiaan 172:sta morfologisesti ja syntaktisesti koodatusta aineistoyksiköstä ja aineiston käytön mahdollistavasta ohjelmasta. Sitä kehitellään yhteistyössä Kotimaisten kielten tutkimuskeskuksen kanssa.
Arkiston 132 murteiden aineistoyksikköä edustavat kaikkia 1800-luvun lopussa ja 1900-luvun alussa nykyisen Suomen alueella puhuttuja suomen kielen alueellisia päämurteita sekä lisäksi niitä murteita, joita puhuttiin Neuvostoliitolle viime sotien yhteydessä luovutetuilla alueilla ennen alueiden luovuttamista. Kukin näyte on aitoa kansanmurretta ja edustaa siis mahdollisimman hyvin asianomaisen pitäjän vanhaa murrepohjaa.
Murreaineiston lisäksi arkistoon sisältyy 40 aineistoyksikköä 1970-luvun lopun ja 1980-luvun alun kirjoitettua yleiskieltä. Yleiskielen tekstilajit edustavat 1) hallinnon kieltä ja virkakieltä, 2) sanomalehtien kieltä, 3) aikakauslehtien kieltä, 4) tietokirjallisuuden kieltä, 5) radion, television sekä puhetilaisuuksien kieltä ja 6) kaunokirjallisuuden kieltä.
Kaikkiaan Lauseopin arkiston korpus käsittää toista miljoonaa sanetta ja noin 200 000 lausetta. Aineistoa voidaan hyödyntää sekä lauseopillisissa että muoto- ja tekstiopillisissa tutkimuksissa.
Vuonna 2007 verkkokäyttöinen atk-korpus Lauseopin X-arkisto on otettu käyttöön. Lauseopin X-arkisto on erittäin helppokäyttöinen atk-korpus, jossa on mahdollista suorittaa
- sanojen muoto-opillisiin aineksiin perustuva haku
- sanojen lauseopillisiin funktioihin perustuva haku
- sanaluokkaan perustuva haku
- sanajärjestyksen huomioiva haku
- kielteisiin ehtoihin perustuva haku
- hakusanoihin perustuva haku
- (toistaiseksi rajoitetusti) merkkijonoihin perustuva haku
- edellä mainittujen yhdistelmiin perustuva haku
- käytettävissä olevien hakusanojen listaus
Lisäksi yksittäisiä aineistoja voi lukea virkkeittäin järjestettyinä ja alkuperäisen nauhoitteen kuuntelukin onnistuu.
Korpus on avoin kaikille tutkijoille, mutta se on ensisijaisesti tarkoitettu Turun yliopiston suomen kielen pää- ja sivuaineopiskelijoille, jotka joko osallistuvat atk-korpuksen hakusanoitukseen tai tarvitsevat atk-korpusta pro gradu ja seminaarityöhön. Vuoden 2009 aikana Kotimaisten kielten tutkimuskeskuksen Kaino-palveluun on tulossa laajalle tutkijayhteisölle tarkoitettu versio, johon on kaikilla vapaa pääsy. Lauseopin X-arkisto sijaitsee Lauseopin arkiston omalla sivustolla ja se on auki arkisin 9:00 - 22:00. Ks. Lauseopin arkisto
Lauseopin arkisto palvelee kulloinkin käytettävissä olevien resurssien rajoissa kielentutkijoita ja -opiskelijoita. Lauseopin arkistossa työskentelee tutkija Nobufumi Inaba. Parhaiten hänet tavoittaa sähköpostitse osoitteesta tai puhelimitse numerosta (02) 333 5394. Lauseopin arkiston osoite on Fennicum, 20014 Turun yliopisto.