Siirry pääsisältöön

Mistä on hyvä hakusana-artikkeli tehty?




Joskus saamme asiakkailtamme palautetta, että sanakirjojemme hakutulokset ovat liian raskaslukuisia. Käyttäjä on yksinkertaisesti halunnut vain yhden käännöksen, thank you very much, ja sen sijaan lukuläksyksi pamahtaa yhdeksäntoista merkitysryhmän hakusana-artikkeli, joka sisältää viisikymmentä esimerkkilausetta. Eikö vähempikin riittäisi? 

Jotta voisimme pureutua tähän kysymykseen, meidän täytyy hieman tarkastella hakusana-artikkelien anatomiaa. Millaista tietoa niissä voi olla? 

Hakusana-artikkelit sisältävät sanan tai sanaliiton kielellisen kuvauksen yhdellä, kahdella tai useammalla kielellä. Lähes kaikki Kielikoneen sanakirjat ovat kaksikielisiä, joten keskityn tässä bloggauksessa niihin.

                                                Esimerkkeinä cher ranska–suomi-sanakirjasta sekä boot englanti–suomi-sanakirjasta

Ensimmäinen elementti hakutuloksessa on pääsana, jonka alta hakusana-artikkelin muut tiedot löytyvät. Pääsanan seurana saattaa olla vain sanaluokka, mutta usein Sanakirja.fi:n artikkeleissa pääsanaan liittyy myös kaikenlaista muuta tärkeää kuten sanan suku, foneettisin aakkosin kirjoitetut lausuntaohjeet, taivutustiedot sekä erinäisiä kielellisiä huomautuksia ja täsmennyksiä. Useimpien pääsanojen vierestä löytyy myös kaiutinnappula, jota painamalla saa kuulla miten robottiääni lausuu sanan, ja taivutustaulukkonappula, jonka takaa avautuu joskus suurikin kokoelma taivutusmuotoja. Kannattaa vilkaista miten kattavasti esimerkiksi ranskan verbien taivutukset on listattu!

Pääsanan alta löytyy artikkelin muu vartalo: käännösvastineet, esimerkkilauseet ja niiden käännökset, usein jaoteltuina useampaan merkitysryhmään. Näiden ryhmien jaotteluun liittyvät synonymian ja polysemian käsitteet. Synonyymit eli samamerkityksiset sanat sopivat samaan ryhmään kun taas polyseemisten sanojen merkitykset eroavat toisistaan enemmän. Hyvä esimerkki monimerkityksisestä sanasta on kieli. Suussamme on kieli, puhumme kieliä, monella soittimella on kieliä. Nämä merkitykset selvästi liittyvät toisiinsa, ja niillä on sama etymologinen pohja, mutta kaikki ne pitäisi selkeässä hakusana-artikkelissa erotella toisistaan, jottei sanakirjan käyttäjällä mene tonguet, languaget ja stringit sekaisin.

Merkitysryhmien jaottelu onkin yksi sanakirjaeditorin haastavimmista hommista, ja siihen tarvitaan lähteiden lisäksi myös roppakaupalla kielellistä intuitiota. Polysemian käsite on nimittäin häilyvä, eikä ole olemassa mitään matemaattista kaavaa, joka kertoisi mihin synonymia loppuu ja mistä polysemia alkaa. 



Oma juttunsa on myös käännösten ja merkitysryhmien järjestys. Niiden lajittelussa täytyy pitää mielessä yksi tärkeä sääntö: tarjoa oleellisin tieto ensin. Vaikka hakusana-artikkeli olisikin erittäin laaja, ensimmäisten ryhmien tulisi kuitenkin pitää sisällään yleisimmät käännökset. Yhdeksäntoista merkitysryhmän hakusana-artikkelia make ei siis tarvitse selailla loppuun asti, jos vastaus käyttötarpeeseen löytyy jo alusta. 

Oikean käännösvastineen valinnassa auttavat myös hyvin valitut käyttöesimerkit, jotka esittävät sanan sen tyypillisissä käyttöyhteyksissä. Pelkkä lista käännöksistä voi johtaa sanakirjan käyttäjän harhateille, mutta esimerkkilauseet kuten “vesi kihahti kielelleni”, “viulussa on neljä kieltä” ja “puhuttu kieli” antavat jo enemmän vihjeitä. Esimerkit konkretisoivat sanan moninaisuuden ja ilmaisuvoiman sekä auttavat kielioppipulmissa kuten oikean preposition valinnassa. Pitikö tekstit nyt kääntää to johonkin vai into johonkin? Esimerkit paljastavat tämänkin!

Pääsanojen lisäksi myös merkitysryhmillä ja yksittäisillä käännöksillä voi olla huomautuksia ja täsmennyksiä, jotka nekin rytmittävät ja selkeyttävät hakusana-artikkelia. Kielioppihuomautukset tunnistaa Sanakirja.fi:ssä hakasuluista kun taas yleisluontoisemmat selitykset löytyvät tavallisten sulkujen sisältä tai merkitysryhmätasolla ilman sulkuja vaaleammalla fontilla kirjoitettuna. Kannattaa vilkaista vaikkapa sanaa selvitä suomi–ruotsi-sanakirjastamme. Huomautukset varmistavat, ettei tule lipsautettua juttukaverille taivaasta tulleen nykter kun haluaa sanoa, että siitä on tullut molnfri.


Huomautusten lisäksi Sanakirja.fi:n sanakirjat sisältävät huiman määrän informaatiota sanojen erikoisalasta, tyylirekisteristä sekä kielivariantista. Erikoisaloja riittää lääketieteestä eläintieteeseen ja elektroniikkaan, kirjanpidosta politiikkaan ja ruoka-alaan – yhteensä aloja on 153 kappaletta, ja ne voi paikantaa tummapohjaisten laatikkojen sisällä olevista teksteistä. Samanlaisista laatikoista löytyy myös tyylirekisterit, jotka kertovat onko sana esimerkiksi arkikielinen, vanhahtava, runollinen taikka ironinen. Kolmas mainitsemani informaation laji, kielivariantit, kertoo millä alueella ilmausta käytetään ja missä merkityksessä. Tämä on erittäin tärkeää, sillä emmehän halua, että Sanakirja.fi:n käyttäjä tilaa Briteissä vahingossa chipsejä kun haluaa crispejä tai huudahtaa erehdyksessä “tabernacle!” vieraillessaan quebeciläisessä kirkossa.

Palataanpa vielä hetkeksi makrotasolle ja sivistyssanojen pariin. Synonyymien ja polyseemien lisäksi sanakirjaeditorit pyörittelevät nimittäin myös homonyymejä. Homonyymit ovat sanoja, joilla on eri alkuperä mutta sama muoto. Sanapari kuusi (puu) ja kuusi (numero) on tuttu esimerkki homonymiasta. Sanakirja.fi:ssä homonyymit tunnistaa pienestä pääsanan yläindeksissä olevasta numerosta, joka kertoo, että samalla tavalla kirjoitetun sanan alta löytyy useampi hakusana-artikkeli. 

Myös eri sanaluokkien sanoja, joilla on sama kirjoitusmuoto, käsitellään kuten homonyymejä. Tällaisia tapauksia on varsinkin englannin kielessä valtava määrä; mainitaanpa vaikka fly (verbi: lentää, substantiivi: kärpänen), watch (verbi: katsoa, substantiivi: rannekello), dry (adjektiivi: kuiva, verbi: kuivata) – tätä listaa voisi jatkaa loputtomiin! Näissäkin tapauksissa merkitysten tarkka lajittelu tekee hakusana-artikkeleiden rakenteesta selkeämmän ja auttaa käyttäjää valitsemaan oikean käännösvastineen. 

Vastaus alun kysymykseen on siis: joskus vähempi ei riitä, sillä emme pääse käyttäjän pään sisälle katsomaan onko haussa kissan kieli, suomen kieli vai viulunkieli. Hakusana-artikkelien rakenteen ymmärtäminen kuitenkin auttaa käännösvastineiden etsinnässä. Apua löytyy myös käyttöliittymästämme, sillä mutteri-ikonin takana olevista asetuksista pääsee muun muassa muokkaamaan hakutulosten järjestystä erikoisalojen perusteella. Jos sinulla hyviä ideoita siitä, miten saamme hakusana-artikkeleistamme vielä selkeämpiä, niin otamme palautteen ilomielin vastaan!



Kommentit

Tämän blogin suosituimmat tekstit

Neljä asiaa, jotka muuttivat ruotsin tunnilla rääkätyn iloiseksi venäjän opiskelijaksi

Minun on tunnustettava, että en ole koskaan pitänyt kielten opiskelusta – en varsinkaan yliopistossa, jossa opettajani Bodil (från Malax i Österbotten) alkoi nauraa päin naamaa, kun rohkaistuin osallistumaan ryhmäkeskusteluun. Hän ei ollut koskaan kuullut kenenkään puhuvan niin surkeaa ruotsia. Nöyryytyksen jälkeen päätin, että pärjään tästä lähtien mainiosti suomella ja englannilla. Tack så mycketBodil!
Kohtalolla näyttää olevan kiero huumorintaju, sillä päädyin töihin Kielikoneelle, joka on täynnä monikielilahjakkuuksia, ja meitä työntekijöitä kannustetaan kielten opiskeluun myös työajalla. Niinpä annoin viime syksynä mahdollisuuden uudelle kielelle ja uudelle opettajalle, Natalialle, ja aloitin venäjän opiskelun kielinerojen kollegoideni kanssa. Ihmeekseni voin nyt todeta olevani koukussa venäjän opiskeluun – cпасибо Natalia! Mutta miten ihmeessä tässä näin kävi?
1. Rima alas ja liikkeelle
“Venäjä on helppo kieli, vain aakkoset ovat vaikeat”, toisteli Natalia johdatellessaan meitä kyr…

Viisi voittoisaa vinkkiä kielenopiskeluun

Jos yksi uudenvuodenlupauksistasi oli oppia uusi kieli, niin lue mitä sisältötiimiläisillämme on sanottavaa kielenoppimisen iloista ja sudenkuopista. Opiskelet sitten omaksi ilokseksi tai vaikkapa työn takia, tunneilla tai itsenäisesti, nappaa mukaasi pari opiskeluvinkkiä!

Elina opiskelee mandariinikiinaa ohjatuilla tunneilla. Piia itseopiskelee ranskaa.


Elina:Avain vieraan kielen ahmimiseen on löytää sisältöä, joka kiinnostaa itseä. Aikoinaan oma englantini parani huimasti, kun oli pakko lukea uusimmat Harry Potterit englanniksi,  jottei joutunut odottamaan suomennosta.

Vastaavasti löysin kiinan opiskeluni melko alkutaipaleella vahingossa Netflixistä kiinalaisen sarjan Meteor Garden, onneksi englanninkielisellä tekstityksellä. Sarja oudosti koukutti vaikka olikin kieltämättä aika huono. Puheesta erotin ehkä keskimäärin 你好,谢谢 ja 我喜欢你. Huomasin, että puheen ymmärtäminen vaatii erityisen paljon harjoittelua, koska kiinaa ei juuri muuten pääse omilla kotikonnuilllani kuulemaan. Siispä länsi…

Sanakirja teki digiloikan eli miten sanakirjasta tuli älykäs

Muistatko vielä ajan, kun sanakirja painoi viisi kiloa ja sen alussa oli 20 sivua käyttöohjeita, lyhenneluetteloita ja sanojen taivutuskaavoja? Tai kun printattu teksti oli niin pientä ja tiivistä, että tarvitsit suurennuslasin ja mietintämyssyn, jotta sait selville, mitä sanakirjassa oikeastaan lukikaan? Tai kun löysit vihdoin sivulta 324 etsimäsi sanan campanula, mutta sen kohdalla lukikin vain “katso bellflower”, ja pläräys alkoi uudestaan…

Perinteisten sanakirjojen käyttökokemus on kauniisti sanoen onneton. Sanakirjojen siirtyminen paperilta digitaaliseen maailmaan onneksi mahdollistaa monenlaisia parannuksia ja vapauttaa sanakirjan tekijät fyysisen maailman rajoituksista kuten maksimisivumääristä ja pienestä fonttikoosta.




Sanakirjan alun lyhenneluetteloa ja taivutuskaavoja ei onneksi enää tarvita. Tila ei ole ruudulla ongelma, joten lyhenteet ja muut kryptiset merkintätavat voidaan avata. Enää ei tarvitse arvailla, onko met metalliala, metsätalous vai metsästys, ja onko genet genet…