Siirry pääsisältöön

Sanakirja ilmaiseksi – kyllä vai ei

Kaikki on nykyään netissä, ja odotusarvo monella meistä on, että jos se on netissä niin se on ilmaista. Tai jos se on kustannettu julkisin varoin, se tulisi saada ilmaiseksi. Tämä näkyy hyvin tänä päivänä myös sanakirjoissa. Painetut isot suursanakirjat ovat lähes kokonaan kadonneet markkinoilta. Hyvällä onnella sellaisen löytää vielä jostain kirjakaupasta tai antikvariaatista, mutta monessa tapauksessa kyseessä on yli kymmenen vuotta vanha painos. Tämä pätee varsinkin yleisimpiin kieliin, englantiin, ruotsiin, saksaan ja ranskaan. Näiden kieliparien painettujen suursanakirjojen tuottaminen on hiipunut Suomessa.

Tarvitaanko sanakirjoja? Ei välttämättä, mutta kaikki varmaan ovat yhtä mieltä että edelleen tarvitsemme luotettavia työvälineitä palvelemaan meitä vieraskielisten (ja miksei äidinkielemmekin) sanojen käytössä ja ymmärtämisessä. Mielikuva netissä olevasta ilmaisesta sanakirjasta on tietenkin siinä mielessä harhaa, että joku netissä olevan sanakirjan aina maksaa, ja maksaa myös siitä että se on jatkuvasti netissä käytettävissä. Ja tämä näkyy tämän päivän nettisanakirjojen tarjonnassa. Ilmaisen sanakirjapalvelujen ongelma on sisältöjen laadun epätasaisuus; monet niistä kun on haalittu erilaisista kokoelmista. Yhdistämällä eri sisältöjä on pyritty luomaan palveluja, jotka vaikuttavat laajoilta ja monipuolisilta.

Hyvä sanakirja ei kuitenkaan synny ilman kielen ammattilaisia. Toisinaan nettisanakirjat ovat vain sanaluetteloita, jotka eivät avusta käyttäjää valitsemaan oikean käännöstä kun sanoilla on monia merkityksiä ja käännöksiä. Vaikka hakusanalle olisikin annettu useampi käännös, niin se ei vielä takaa sitä, että hakutuloksesta olisi hyötyä. Otetaanpa kuvitteellinen esimerkki sanasta aine:

1) substance 2) matter 3) subject 4) topic 5) stuff

Kaikki ihan oikeita käännöksiä sanalle aine, mutta palveleeko tämä käyttäjää? Jos sanakirjan käyttäjä haluaisi aine-sanaa merkityksessä “kirjoittaa aine koulussa”, niin ei tällainen sanalista vielä auta valitsemaan oikeaa merkitystä. Hyvään sanakirjaan tarvitaan käyttöalatieto, kielioppitietoa, tarkentavaa tietoa sanan ja käännöksen käytöstä ja myös hyviä esimerkkejä. Esimerkiksi Sanakirja.fi antaa hyvin kattavasti tietoa sanan aine käytöstä.

Kun sanakirja pyritään tekemään minimaalisin kustannuksin, ja silti saamaan siihen mahdollisimman paljon sisältöä, herää tietenkin ajatus parantaa sanalistojen laatua yhdistämällä niihin automaattisesti käyttöesimerkkejä. Mutta onko oikotietä poimia käyttöesimerkkejä sanakirjaan luotettavasti ilman ammattilaisia? Esimerkiksi Euroopan parlamentin asetuksia on käännetty monille kielille. Näitä hyödyntämällä sanakirjaan saattaisi päätyä käyttöesimerkiksi vaikkapa seuraava lausepari:

Nykyisillä ohjelmistomenetelmillä on helppo yhdistää eri kielille käännetyistä teksteistä toisiaan vastaavat lauseet. Yllä oleva esimerkki on sinänsä oikea, mutta virallisissa asetuksissa käytettävä kieli ja sanonnat sekä lauseen monimutkaisuus vaikeuttavat sanakirjan käyttäjää hahmottamaan miten sanaa aine tässä oikein on käytetty. Näin ei siis saada hyviä käyttöesimerkkejä sanakirjaan. Näyttää siltä, että määrä korvaa laadun. Pyritään luomaan kuva hyvästä, monipuolisesta ja laadukkaasta sanakirjapalvelusta, joka aikaansaadaan yhdistämällä erilaisia vapaasti netistä saatavia kielen resursseja. Sanakirjatyön ammattilainen olisi varmaan valinnut käyttöesimerkiksi vaikkapa:

Kun sanakirjan laatimisessa tukeudutaan ilmaiseksi saataviin aineistoihin, seurauksena on sanakirjan laadun kannalta isojakin ongelmia. Moni sisältö on laadittu talkootyönä, eikä ole välttämättä edes tarkoitettu sanakirjan aineistoksi. Pahimmassa tapauksessa sanakirjaan päätyy käännöksiä, jotka ovat väärällä kielellä. Sisällön päivittäminen ja ajan tasalla pitäminen on myös oma haasteensa. Kieli kehittyy koko ajan, ja sanakirjat vaativat jatkuvaa päivittämistä palvellakseen käyttäjiä. Parhaimmillaan ammattilaisten tuottamat sanakirjapalvelut kuten esimerkiksi Sanakirja.fi tarjoavat jopa mahdollisuuden jättää käännöspyyntöjä sanoista, joita ei löydy ja jotka sitten lisätään pikaisestikin sanakirjaan.

Kun sanakirja on käyttäjille ilmainen, niin tosiasiassa sen pitäminen yleisön saatavilla netissä maksaa aina jotakin. Monien palveluiden kustannukset on katettu mainonnalla, mistä aiheutuu lieveilmiöitä. Mainosten seasta on vaikea hahmottaa todellista sanakirjasisältöä, sillä osa hakusana-artikkelista jää monestikin piiloon sivun alareunaan kun mainokset vievät leijonanosan tilasta. Toinen iso mainonnan mukanaan tuoma epäkohta on se, että sivulle pitää saada liikennettä, jotta mainoksia näytettäisiin. Niinpä jotkut nettisanakirjat indeksoivat kaikki sanakirjan hakusanat (ja monesti myös sanat joita ei sanakirjassa edes ole) Google-hakuun saadakseen käyttäjiä sivuilleen. Melkein minkä tahansa suomenkielisen sanan hakeminen tuo ensimmäisenä ison kasan linkkejä eri sanakirjapalveluiden hakusana-artikkeleihin.

Kun ei voi kilpailla sisällön laadulla, niin sitten kilpaillaan sanojen määrällä. Kuinka paljon sanakirjassa voi olla sanoja? Tämä on hyvä kysymys, koska potentiaalinen sanojen määrä on todella suuri. Esimerkiksi suomenkielisessä Wikisanakirjassa on noin 385 000 artikkelia. Kyseessä siis näennäisesti hyvinkin laaja sanakirja, mutta artikkelien määrä ei ole sama kuin suomenkielisten hakusanojen määrä, sillä mainittu summa on Wikisanakirjan kaikkien kielten hakusana-artikkelien määrä yhteensä. Palvelun ilmoittamaan sanamäärään on siis aina syytä suhtautua varauksella. Lisäksi Wikisanakirja ei edes ole varsinaisesti sanakirja vaan hakuteos, joka sisältää mm. paikannimiä, sukunimiä ja etunimiä. Todellinen sanakirjasisältö ei siis ole merkittävä. Sama pätee muiden kielten wikisanakirjoihin. Kuitenkin näistä eri kieleten wikisanakirjoista on koostettu sanakirjapaveluja aineistoja yhdistämällä. Sen sijaan laajin markkinoilla oleva toimitettuun sisältöön pohjautuva suomienglanti-sanakirja sisältää yli 400 000 suomenkielistä hakusanaa.

Sama, mikä pätee moneen muuhunkin asiaan, pätee myös sanakirjaan: moni kakku päältä kaunis tai eurolla saa euron tavaran. Ammattilaisten tekemä sanakirja on ihan toista maata, ja siihen voi luottaa.



Kommentit

Tämän blogin suosituimmat tekstit

Viisi voittoisaa vinkkiä kielenopiskeluun

Jos yksi uudenvuodenlupauksistasi oli oppia uusi kieli, niin lue mitä sisältötiimiläisillämme on sanottavaa kielenoppimisen iloista ja sudenkuopista. Opiskelet sitten omaksi ilokseksi tai vaikkapa työn takia, tunneilla tai itsenäisesti, nappaa mukaasi pari opiskeluvinkkiä! Elina opiskelee mandariinikiinaa ohjatuilla tunneilla. Piia itseopiskelee ranskaa. Elina: Avain vieraan kielen ahmimiseen on löytää sisältöä, joka kiinnostaa itseä. Aikoinaan oma englantini parani huimasti, kun oli pakko lukea uusimmat Harry Potterit englanniksi,  jottei joutunut odottamaan suomennosta. Vastaavasti löysin kiinan opiskeluni melko alkutaipaleella vahingossa Netflixistä kiinalaisen sarjan Meteor Garden, onneksi englanninkielisellä tekstityksellä. Sarja oudosti koukutti vaikka olikin kieltämättä aika huono. Puheesta erotin ehkä keskimäärin 你好,谢谢 ja 我喜欢你. Huomasin, että puheen ymmärtäminen vaatii erityisen paljon harjoittelua, koska kiinaa ei juuri muuten pääse omilla kotikonnuilll

Voisitteko poistaa tämän sanan?

Sanakirjat ylittävät harvoin uutiskynnyksen. Olen huomannut, että sanakirjajutut katsotaan klikkauskelpoisiksi yleensä kahdessa tapauksessa: silloin kun johonkin merkittävään yksikieliseen opukseen on lisätty uusia sanoja (“nyt Kielitoimiston sanakirjasta löytyy lähimaksu, mikroilme ja ignoroida!” ) ja silloin kun sanakirja on loukannut jotakuta ihmisryhmää.  Sanakirjojen seksismistä olen kirjoittanut jo aiemmin. Samaa debattia on käyty myös muualla. Esimerkiksi Oxford English Dictionaryn ja italialaisen Treccani-sanakirjan nainen- sanakirjan synonyymejä, määritelmiä ja esimerkkilauseita on ihmetelty, ja niiden muokkaamista on vaadittu kampanjoilla. Kaikki eivät jaksa seksismistä vihastua, ja sen puolustelijoita tunnetusti löytyy nettikommenteista mielin määrin, mutta varmasti melkeinpä kaikkiin osuu jokin kalikka ja kipeästi. Miltäs maistuu ruotsalainen slangisanakirja , jossa finländare ja finne tarkoittavat huonoa, epäystävällistä ja tyhmää? Mekin saamme aika ajoin palautetta

Kielikertomuksia Senegalista

Lentokoneen ikkunasta paistaa aavikon hehku, ja turbulenssin lisäksi mahanpohjaa kutkuttavat perhoset – tämä “tubaab” on pian saapumassa Afrikan läntisimpään maahan, Senegaliin. Matka on ollut bucket-listani kärjessä siitä lähtien, kun tapasin poikaystäväni seitsemän vuotta sitten. Millainen on tuo kiehtovan monikielinen maa, josta hän on kotoisin? “Salaam aleikum, ça va? Na nga def?” Jo ensimmäiset kuulemani tervehdykset pitävät sisällään kolmea eri kieltä, mikä suomalaisen korvaan kuulostaa hieman kummalliselta, mutta on täysin normaalia senegalilaisen arjessa. Arjessa, joka on täynnä eri kielten kohtaamisia. Senegalissa puhutaan paikallisten keskuudessa yli 30 eri kieltä, ja maan virallinen kieli ranska ei suinkaan ole se niistä kaikista puhutuin. Poikaystäväni perheessä raikuu Senegalin puhutuin kieli wolof sekä hieman harvinaisempi pulaar; ranskaa he puhuvat yleensä vain virallisia asioita hoitaessa tai sulassa sovussa sekaisin wolofin kanssa. Perheen mummo tosin ei