Gå til hovedinnhold

    Verktøy for tverrskandinavisk maskinomsetjing

    Kevin Brubeck Unhammer

    Kevin Brubeck Unhammer

    Skrevet av Kevin Brubeck Unhammer. Brubeck Unhammer er språkteknolog og utviklar i Apertium-prosjektet, samt storbrukar av Wikipedia (med små bidrag innimellom).

    Wikipedia fekk nyleg eit nytt beta-verktøy for omsetjing av artiklar:
 *Content Translation*, eller *innhaldsomsetjing*. Dette verktøyet skal
 automatisera ein del av omsetjingsjobben, som det å spora opp kva dei
 omsette lenkjene og kategoriane er på målspråket, og å slå opp termar
 i ordbøker. Målet er å sleppa å bla fram og tilbake mellom ein masse
 ulike faner medan du skriv, og dermed kunna fokusera på sjølve
 omsetjinga.
 *Innhaldsomsetjing* kan i tillegg gi deg ei grovomsetjing av heile
 avsnitt ved hjelp av maskinomsetjingsverktøyet Apertium.

    Maskinomsetjing er, som me veit, feilbarleg, så desse grovomsetjingane
må sjølvsagt finlesast og rettast for hand. Men verktøyet er laga med 
tanke på dette, og gir deg ei åtvaring dersom du prøver å publisera
 noko som ser ut til å ikkje ha blitt endra nok på etter 
maskinomsetjinga.
 Uheldigvis er det langt frå alle moglege språkpar som har
 maskinomsetjingsstøtte frå Apertium; mellom anna manglar svensk↔norsk
 og dansk→norsk. Derfor søkte eg tidlegare i haust om eit Individual
 Engagement Grant frå Wikimedia Foundation for å utvikla dette, og fekk 
nyleg godkjend den søknaden (søknaden kan leses her).

    Eg har tidlegare jobba med nynorsk↔bokmål og andre system i Apertium, så utfordringa er kjend, og dei nye
 systema blir i stor grad basert på kode og ordlister frå tidlegare
 system. Med meg på laget har eg òg Francis Tyers, som har doktorgrad i maskinomsetjing, og har jobba med omtrent alt som har å gjera med Apertium. Det skal ikkje bli veldig lenge til det går an å få maskinomsetjingsforslag frå svensk og dansk når du omset
 wikipediaartiklar til norsk!

    Viss du har lyst til å beta-testa sjølve redigeringsverktøyet, så går
 det an å skru det på allereie no i brukarinnstillingane dine (under
«Beta») og prøva det ut på t.d. nynorsk↔bokmål. Sjå
 https://www.mediawiki.org/wiki/Content_translation#Try_the_tool for
 meir informasjon, men hugs at verktøyet er under utvikling.
 Viss du er interessert i å følgja med på maskinomsetjingsprosjektet,
 så kjem eg til å oppdatera
 https://meta.wikimedia.org/wiki/Skanwiki/Skanwikiprojekt_MT – elles
 kjem det ofte meir generelle oppdateringar frå Content
  Translation-utviklarane på #
>

     

    Kategori: Blogg, Nyheter, Ukategorisert, Uncategorized, Wikipedia
    Stikkord: ,

    Skriv en kommentar