“Voisitteko korjata tämän?” T. Uskollinen sanakirjan käyttäjä

2.7.2019


Aiemmassa  bloggauksessani kehotin Sanakirja.fi:n käyttäjiä lähettämään minulle pullopostia käännöspyyntöjen muodossa. Ja pyyntöni on kuultu – mahtava juttu!

Viime aikoina olen lisännyt englannin sanakirjaan muun muassa seuraavia sanoja käyttäjien vinkkien perusteella: EU-komissaari, pekkanen, äikkä, verkko-opetus, ruusukulta ja ruokahävikki. Samalla muut editorimme ovat ahkeroineet ehdotuksianne toisiin kieliin.

Käännöspyyntöjen lähettäminen suoraan leksikografien työlistalle on aika uusi ominaisuus, mutta perinteisempiä palautteita on tipahdellut (sähköiseen) postilaatikkoomme jo monen monituista vuotta. Palautteita on arkistoitu vuodesta 2006 lähtien, mutta niitä on lähetetty jo kauan ennen tuota. Nyt esitänkin nöyrän pyynnön kesälaitumilla laukkaaville sanakirjan plaraajille: jos MOT Sanakirjoissa® tulee vastaan virhe tai puute, niin ei kuin vain postia tulemaan!

Miten saat palautteesi perille?

Pulloposti mainittiin jo, mutta se ei ehkä ole varmin tapa saavuttaa meidät vaikka toimistomme sijaitseekin Helsingissä Salmisaaren rannalla. Kuvan kaltaisia postikortteja voi toki myös lähettää, mutta ehkä yksinkertaisinta on naputella sähköpostia osoitteeseen asiakaspalvelu@kielikone.fi tai klikata jokaisen hakutuloksen vieressä olevaa kolmen pisteen ikonia ja valita “Anna palautetta”. Jälkimmäisellä metodilla voit halutessasi lähettää viestisi myös anonyymisti.

Palautteita tulee varsin säännöllisesti. Laskin, että esimerkiksi toukokuun aikana viestejä saapui 22 kappaletta eli noin yksi per arkipäivä. Melkein joka aamu palauteboksissa odottaa siis uusi huomio sisällöistämme.

Risuja ja ruusuja

Ja tällaista tavaraa postilaatikostamme löytyy: huomautuksia käännös- ja lyöntivirheistä, ehdotuksia uupuvien merkitysten lisäämiseksi, asiantuntijoiden huomioita termeistä sekä kokonaisia luetteloja puuttuvista sanoista. 

Joku toivoo lisää kemian termejä, joku lähettää 50-kohtaisen listan korjauksia espanjan sanakirjaan, joku toivoo hakusana-artikkelin esittämistapaan muutoksia. Joskus aivan ihastelen, miten paljon käyttäjämme ovat valmiita uhraamaan aikaansa ja asiantuntemustaan sanakirjojemme kehittämiseen. Yleensä palautteenantajat ovat myös erittäin kohteliaita; monet ovat jopa äimistyneitä loistavaan sanakirjaan livahtaneesta typosta. Ruusujakin tulee joskus! 

Reagoimme jokaiseen palautteeseen mahdollisimman nopeasti. Sanakirjamme on dynaaminen, jatkuvasti muokkautuva, ja asiakkaiden toiveet asetetaan usein etusijalle. Joskus palautteet ovat pistäneet jopa monen kuukauden päivityssuunnitelmat aivan uusille raiteille. Siis, tiedoksi meidän merimaisemista teidän mökkilaitureille – palautteellanne on väliä, älkää siis epäröikö lähettää sitä!




Neljä asiaa, jotka muuttivat ruotsin tunnilla rääkätyn iloiseksi venäjän opiskelijaksi

18.6.2019


Minun on tunnustettava, että en ole koskaan pitänyt kielten opiskelusta – en varsinkaan yliopistossa, jossa opettajani Bodil (från Malax i Österbotten) alkoi nauraa päin naamaa, kun rohkaistuin osallistumaan ryhmäkeskusteluun. Hän ei ollut koskaan kuullut kenenkään puhuvan niin surkeaa ruotsia. Nöyryytyksen jälkeen päätin, että pärjään tästä lähtien mainiosti suomella ja englannilla. Tack så mycket Bodil!

Kohtalolla näyttää olevan kiero huumorintaju, sillä päädyin töihin Kielikoneelle, joka on täynnä monikielilahjakkuuksia, ja meitä työntekijöitä kannustetaan kielten opiskeluun myös työajalla. Niinpä annoin viime syksynä mahdollisuuden uudelle kielelle ja uudelle opettajalle, Natalialle, ja aloitin venäjän opiskelun kielinerojen kollegoideni kanssa. Ihmeekseni voin nyt todeta olevani koukussa venäjän opiskeluun – cпасибо Natalia! Mutta miten ihmeessä tässä näin kävi?

1. Rima alas ja liikkeelle

“Venäjä on helppo kieli, vain aakkoset ovat vaikeat”, toisteli Natalia johdatellessaan meitä kyrillisten kirjainten maailmaan. Ja helpolta alku tuntuikin, sillä keskityimme ensin sanoihin, joissa suurin osa kirjaimista oli samoja kuin latinalaisissa aakkosissa ja merkitys helposti arvattavissa, esimerkiksi мама ja метро. Opimme heti myös esittelemään itsemme, ja sehän vasta helppoa olikin! Venäjässä kun ei yleensä käytetä olla-verbiä ja minäkin sain sanottua posket hehkuen koko ryhmälleя Aiju”.

Vähitellen selvisi, että aivan näin yksinkertainen kieli venäjä ei sentään ole (olin kyllä sitä ounastellutkin), mutta Natalian asenne kantoi minut hitaan aakkosten opettelun yli. Tai no, muiden paitsi s-kirjaimen osalta – en edelleenkään kuule seitsemän eri ässän eroa ja äännän melkein kaikki suhut samalla tavalla, mutta venäläiset eivät kuulemma siitä piittaa.

2. Kieli on mieli

Venäjän tuntien herkkupaloja ovat Natalian tarinat, jotka avaavat oven kielen kautta venäläisten mieleen. Olen nyt ymmärtänyt, miksi Dostojevskin klassikoissa samaan henkilöön viitataan usealla eri nimellä (piirre, jonka takia kirjojen henkilöt menevät minulla lukiessa jatkuvasti sekaisin). Venäjän kielessä kutsumanimellä kuvataan suhteen läheisyyttä. Vieraat ihmiset puhuttelevat toisiaan etu- ja sukunimellä, tutummat käyttävät pelkkiä etunimiä ja kaikkein läheisimmät ystävät kutsuvat toisiaan hellittelynimillä: esimerkiksi Ivanista tulee Vanja, Katerinasta Katja ja Aleksandrasta Saša.


Natalia on herättänyt minut myös miettimään historian vaikutusta kieleen ja toisaalta kielen vaikutusta asenteisiin. Voivatko venäläiset suhtautua työn tekemiseen (работатьtavoiteltavana asiana, kun verbin kantasana раб tarkoittaa orjaa? Tai heijastuuko nykynaisen asemaan naimisissa olevaa naista tarkoittava sana замужем, joka merkitsee kirjaimellisesti “miehen takana”? Entä millaisen historiallisen kehityskulun seurauksena есть-verbillä viitataan sekä syömiseen, olemiseen että omistamiseen?

3. Se tunne, kun oppii

Pelkästään aakkosten osaaminen innosti minua miettimään reissua Pietariin. Kaupunki tuntuisi nyt ihan erilaiselta, kun pystyisi lukemaan ainakin katukyltit, metropysäkit ja ruokalistan. Tällä minimaalisella venäjän taidollani olisin jo paljon ummikkoturistia etevämpi matkailija. прелесть!

Natalialla on tapana tunnin aluksi luetuttaa meillä venäläisten uutisten otsikkoja ja ai että tuntuu hienolta, kun aiemmat hieroglyfit alkavat hahmottua merkityksellisiksi sanoiksi ja lauseiksi! Myönnettäköön, että otsikon vieressä on kuva ja olemme katsoneet uutiset ennen lukukierrosta suomenkielisen tekstityksen kera, mutta silti: ymmärtäminen on todella koukuttava kokemus.

4. Nykyaikaiset apuvälineet

Kielen opiskelun perusasiat eivät ole muuttuneet sitten Bodilin ruotsintuntien: edelleen puhuminen uudella kielellä on tuskaa, kova kalloni vaatii valtavan määrän toistoja sanojen muistamiseksi ja opittu unohtuu nopeasti, jos en harjoittele päivittäin. Oppitunti kerran viikossa ei todellakaan riitä.

Mutta digitalisaatio näyttää parhaat puolensa kielten opiskelijalle. Puhelimeen asennettu Duolingo-sovellus muistuttaa joka ilta harjoittelusta ja yleensä opiskelen venäjää viisi minuuttia vaakatasossa päivän päätteeksi. Usein kaivan sovelluksen esille myös työmatkalla junassa. Kotitehtäviä tehdessäni Sanakirja.fi on ahkerassa käytössä – katson käännöksiä, tarkistan ääntämistä ja kirjoitusasuja sekä etsin esimerkkilauseita. Joskus teen myös oman sanalistan ja harjoittelen uusia sanoja pelaillen.

Epäröin viime syksynä venäjän opiskelun aloittamista, koska kielten opiskelu on kamalaa (kiitos vielä kerran Bodil), koska olen jo keski-iässä, koska minulla ei ole aikaa, koska en kuitenkaan opi ja jos opin, niin hankittu kielitaito liukenee joskus pois. Mutta nyt ajattelen toisin. Kielten opiskelu innostavan opettajan johdolla on avartava kulttuurikylpy, eikä sellaiseen ole koskaan liian vanha (sitä paitsi kielten opiskelu ehkäisee dementiaa). Aikapula on tekosyy, sillä uudet digitaaliset työkalut mahdollistavat kielten opiskelun pienissä aikaraoissa ja usein, mikä on aivotutkimuksen mukaan paras tapa oppia kieliä. Ja vaikka joskus unohtaisin jokaikisen kyrillisen kirjaimen, niin tulen aina muistamaan Natalian tarinat ja yhdessä työkavereiden kanssa koetut oppimisen ilon läikähdykset. Kiitos Natalia ja ensi syksynä jatketaan!


Millaisia kokemuksia sinulla on kielten opiskelusta?



Trust me, I’m a machine

28.5.2019


Tekstin tai puheen kääntäminen on vaikeaa ihmiselle. Onko se yhtään sen helpompaa koneelle? Tuleeko kone korvaamaan ihmiskääntäjät? Lyhyt vastaus: kyllä ja ei. Ihmiskieli on kaikessa kauneudessaan ja kirjavuudessaan monimutkaista monellakin tapaa, josta aiheutuu monenlaisia erilaisia haasteita niin ihmisille kuin koneillekin käännettäessä kieltä toiseksi. 

Kielen monitulkintaisuus on yksi kääntämisen suurimmista ongelmista. Jotta voit kääntää (tai ylipäätään tulkita) sanat “kuusi palaa”, täytyy ensin tietää missä yhteydessä ne esiintyvät. Onko kyseessä esimerkiksi kuusi palaa leipää, liekehtivä kuusipuu vai sci-fi-romaani jossa taivaankappaleet tulevat ja menevät?

Tai sanamuoto “alusta” - onko kyseessä “alusta”-substantiivi perusmuodossa, “alku”-sanan elatiivi (“aloitetaan alusta”),  “alus”-sanan partitiivi (“armeija osti kolme alusta”), vai mahdollisesti “alustaa”-verbin imperatiivi (“Alusta tuo kovalevy!”)? Vaiko kenties “alunen”-sanan partitiivi (“Tarvitsemme teekupeille kolme alusta”)? 

Monitulkintaisuuden lisäksi erityisesti idiomit ja sanonnat, joiden merkitys on kuvaannollinen eikä kirjaimellinen, aiheuttavat koneelle ongelmia. Samoin puhekieliset ilmaisut, slangi, murteet ja kirjoitusvirheet hämmentävät usein konekääntäjää.


Usein oikea käännös riippuu oleellisesti myös tosimaailman ominaisuuksista: onko jokin asia elollinen vai eloton, onko se kulkuväline vai huonekalu vai syötävä… Joskus koneen väärin kääntämät tulokset ovat huvittavia, joskus enemmänkin karmaisevia.
Kolmas ongelma on konteksti kieli on riippuvaista tilanteesta, kulttuurista, puhujista ja lauseyhteydestä. Konekääntimet analysoivat tekstiä yleensä lause kerrallaan, eivätkä siis tiedä mitään edes edellisissä lauseissa mainituista asioista, saati sitten muusta laajemmasta kontekstista.








Mihin konekääntäminen perustuu?

Konekääntimiä on erilaisia: osa perustuu käsin kirjoitettuihin sääntöihin, osa tilastollisiin menetelmiin ja osa neuroverkkoihin. Kaikissa on omat hyvät ja huonot puolensa.

Sääntöpohjaiset järjestelmät jäsentävät tekstin ensin osasiin ja kääntävät sen sitten kohdekielelle sanakirjan ja erilaisten sääntöjen perusteella. Niiden ongelma on lähinnä siinä, että on mahdotonta kuvata säännöillä kaikkia mahdollisia kielen ilmiöitä. Tiettyyn pisteeseen asti ne kuitenkin toimivat erittäin hyvin.

Tilastollisiin menetelmiin perustuvat konekääntäjät sen sijaan käyttävät hyväksi suuria tekstimassoja, joissa sama teksti on käännetty usealle kielelle. Tilastolliset kääntimet kääntävät laadukkaasti sellaisia tekstejä, jotka ovat niille tuttuja. Ongelmana on löytää tarpeeksi laajoja ja laadukkaita tekstimassoja. Käytetyissä teksteissä myös heijastuu tosimaailman ongelmat ja asenteet. Tästä johtuu esimerkiksi se, että Google Translate kääntää suomen kielen sukupuolineutraalin “hän”-pronominin englanniksi välillä “he” ja välillä “she” riippuen siitä, kumpi on sen analysoimissa tekstimassoissa ollut yleisempi samantyyppisissä yhteyksissä.

Neuroverkkopohjaisissa kääntäjissä yhdistyvät säännöt sekä tekstimassojen käyttö pohjana käännöksille, että myös koneoppiminen - koneelle voidaan opettaa, mitkä käännökset ovat hyviä ja mitkä huonoja, ja sen perusteella laatu jatkuvasti paranee. Tämäntyyppiset kääntäjät ovat viime vuosina yleistyneet ja niissä onkin suurin potentiaali parantaa konekäännöksen laatua jatkossa.

Sanakirja tarjoaa useita vaihtoehtoja

Konekääntäjä on yhtä aikaa tyhmä ja fiksu. Se antaa parhaan arvauksensa käännökseksi, mutta mitään varmuutta sen oikeellisuudesta ei ole. Arvaus perustuu niihin sääntöihin ja niihin tekstimassoihin, joita kääntäjälle on opetettu.

Konekäännöksen vaara verrattuna sanakirjaan onkin siinä, että huonokin sanakirja yleensä tarjoaa useita käännösvaihtoehtoja, joista hyvällä tuurilla ja pienellä päättelyllä voi valita oikean. Konekäännin sen sijaan tarjoaa ainoastaan yhden mielestään parhaan käännöksen, usein kertomatta mitä muita mahdollisia käännöksiä olisi voinut olla, tai miksi se päätyi tähän käännökseen. On vaikeaa tietää, mikä menee pieleen ja miksi käännöksessä ei joskus tunnu olevan mitään järkeä. Jos käännettävää kieltä ei osaa kovin sujuvasti, on myös hankalaa arvioida, onko käännös oikeasti hyvä vai ei.
Milloin kone sitten kääntää tekstiä yhtä hyvin kuin ihminen? Jo tänään, ja ehkä ei ikinä.

Konekäännös on erittäin hyvä työkalu varsinkin säännönmukaisille teksteille, ja vaikkapa auttamaan tekstin ymmärtämisessä. Jo nyt konekääntäjät ovat suureksi avuksi esimerkiksi käyttöoppaiden ja teknisten materiaalien kääntämisessä.

Sen sijaan kaunokirjallisuus ja muut luovuutta vaativat tekstityypit tulevat vielä pitkään, ehkä ikuisesti, vaatimaan ihmistä. Tekstiä voi mekaanisesti kääntää, mutta voiko tekstin sielua?


Seksistinen sanakirja?

24.4.2019


Joitakin vuosia sitten saimme painavaa palautetta englanti–suomi-sanakirjamme hakusana-artikkelista renowned. Artikkeli sisälsi kaksi esimerkkilausetta, joista toinen oli She is renowned for her beauty ja toinen He is renowned as a thinker. Siis että nainen oli tunnettu kauneudestaan ja mies aivoistaan! Eikä tässä kaikki: palautteen antajan mukaan sanakirja sisälsi muitakin esimerkkejä, jotka tuntuivat vihjaavan, että nainen on yksinkertainen ja kiinnostunut lähinnä ulkonäöstään.

Miksi näin? Miten asialliseen lähdeteokseen on voinut tupsahtaa näin asenteellista kamaa? Palatkaamme siihen hieman myöhemmin. Jos olet päässyt tähän asti ja mietit, että mitä kukkahattutätien lätinää tämä nyt on, niin voin vakuuttaa, että tasa-arvoasioiden miettimistä ei pääse pakoon edes pölyisten sanakirjojen kohdalla. Maailma on sukupuolittunut, ja niin on myös kieli, mikä pakottaa sanakirjatyöläiset tekemään aivan käytännön päätöksiä.

Viime kuukausina sisältötiimimme on puurtanut kuin pienet muurahaiset, ja olemme lisänneet sanakirjakekoomme muun muassa WSOY:n aikaisemmin omistamat suomi–ranska–suomi-, suomi–venäjä–suomi- ja saksa–suomi-sanakirjat. Näitä kaikkia kolmea kieltä yhdistää substantiivien suvut. Ja suvut ne vasta päänvaivaa aiheuttavatkin!

Maskuliini jyrää

Printtisanakirjojen maailmassa on ollut hyvin tyypillistä, että jos sanasta on olemassa sekä maskuliini- että feminiinimuoto, sanakirja tarjoaa vain maskuliinia, ja varsinkin säännöllisten feminiinipäätteiden muodostus on sälytetty sanakirjan käyttäjän kontolle. Syy tähän on ollut yksinkertainen: tilan puute. Meidät sähköisten sanakirjojen tekijät on sen sijaan vapautettu sivun ikeestä, ja voimme antaa myös feminiinimuodoille sen tilan, jonka ne ansaitsevat. Tai siis ainakin melkein.

Ahkerat Sanakirja.fi:n käyttäjät ovat varmasti huomanneet, että esimerkiksi ranska–suomi-sanakirjastamme voi hakea myös feminiinipäätteisiä sanoja ja hakutulos löytyy. Feminiinimuoto on kuitenkin maskuliinimuodon alla pienemmällä präntillä, niin sanottuna vaihtoehtoisena muotona. Reilua? Ehkei täysin. Olisimme voineet tehdä myös toisenlaisen ratkaisun ja luoda kaikille muodoille omat hakusana-artikkelinsa. Mutta tällainen päätös olisi pistänyt lumipallon liikkeelle ja pakottanut editorimme tekemään jatkossa kaksinkertaisen määrän työtä. Lisäksi eristetyt maskuliinit ja feminiinit eivät kertoisi koko totuutta sanasta ja sen käytöstä. Esimerkiksi ranskassa miehiä ja naisia sisältävästä porukasta puhuttaessa käytetään aina maskuliinimuotoa. Perusoletus ihmisestä on mies.

Mites suomi?

Kiljaisitko nyt riemusta suomen kielen puolesta – ei sukuja, ei seksismiä? Ikävä kyllä joudun toimimaan viestintuojana. Myös suomi on vahvasti sukupuolittava, kuten Kielikellossa kattavasti kerrotaan. Vaikka suomessa sanoilla ei ole sukua, niin kielestämme löytyy kyllä vino pino esimiehiä, liikemiehiä, lautamiehiä ynnä muuta porukkaa. On jokamiehenoikeutta, miesmuistia ja miestyövuosia. Ja näitä ilmaisuja käytämme jatkuvasti – aivan muina miehinä!
Sukupuolittuneet ammattinimikkeet ovat askarruttaneet myös asiakkaitamme. Pari vuotta sitten saimme palautetta avainhenkilön käännösvastineesta keyman. Sanakirjan käyttäjä ehdotti osuvampaa käännöstä key person. Muokkasin artikkelia mielelläni ehdotuksen mukaiseksi ja kävin kuvitteellinen viidakkoveitsi kädessäni vastaavien tapausten kimppuun. Mutta jossain vaiheessa piti luovuttaa ja vetäytyä takaisin asemiin. Sillä vaikka mielelläni lisäisin Speaker-sanalle puhemiehen seuraksi myös käännökset puhenainen ja puheenjohtaja, niin nuo termit eivät ole politiikan maailmassa vielä yleistyneet käyttöön. Tälläkin hetkellä eduskunnan nuijaa heiluttaa rouva puhemies! Sanakirjat kuvaavat sitä kieltä, joka on oikeasti käytössä.

Palatkaamme alun käyttöesimerkkeihin. Niitä ei välttämättä ole poimittu sanakirjaan sen takia, että leksikografi olisi tarkoituksella halunnut luoda kontrastin naisten ja miesten avujen välille. Suurin osa englannin sanakirjan esimerkkilauseista on peräisin korpuksesta eli valtavasta kokoelmasta aitoja, lähtökielisiä tekstejä. Lausepari (She is renowned for her beauty ja He is renowned as a thinker) on siis päätynyt sanakirjaan, koska tuollaisia lauseita ja ajatuksia lauseiden takana esiintyy tiheästi tässä maailmassa, jossa elämme. Mutta kun lauseet ja ajatukset pikkuhiljaa muuttuvat niin leksikografikin voi osallistua muutostalkoisiin, yksi hakusana-artikkeli kerrallaan.