From Wikipedia, the free encyclopedia
Google Translate (ingelesez, "Google itzultzailea") itzultzaile eleanitz automatikoa da, Googlek garatu eta eskaintzen duena, testuak, ahotsa, irudiak edo bideoak denbora errealean itzultzeko. Web interfazeaz gain, iOS eta Androiderako interfaze mugikorrak eskaintzen ditu, baita API bat ere, garatzaileei web nabigatzaileentzako gehigarriak, aplikazioak eta beste software batzuk garatzeko aukera ematen diotena. Google-ko itzultzaileak 103 hizkuntza maila ezberdinetan itzultzeko kapazitatea du, zerbitzu hau guztiz dohainekoa da eta egunero 200 milioi pertsonek erabiltzen dute.[1]
URL helbidea | translate.google.com |
---|---|
Komertziala? | Bai |
Webgune mota | Estatistikan oinarritako itzulpen automatikoa |
Erabiltzailea erregistratzea | Aukerakoa |
Hizkuntza(k) | 90+ hizkuntza |
Jabea | |
Egilea | |
Argitalpen data | 2006ean; duela 12 urte (makina erregeletan oinarritutako itzulpena bezala) 2007ko Urrian; duela 11 urte (estatistikan oinarritutako itzulpen automatikoa bezala) |
Egoera | Eskuragarri |
2016ra arte Google-k estatistikan oinarritutako itzultzaileak erabili zituen, baina 2016ko azarotik itzulpen automatiko neuronalean oinarritutako dagoen bertsio berri bat ezarri zuen; hasieran hizkuntza gutxi batzuetarako, baina geroago papurka hzkuntza gehagotara zabal tzen ari da sistema neuronala. Itzultzaile automatiko horri dinamikoki hobetzeko aukera emateko intentzioarekin. Erabiltzaileen kontsultekin eta denborarekin sistema ikasten doa, eta horrela bere itzulpenen kalitatea hobetzea lortzen du.
2016ko abendutik, testuen dohaineko itzulpena 5000 karakteretara mugatu da, nahiz eta web-guneena inongo mugarik ez duen.[2]
Zenbait hizkuntzatan Google-ko itzultzaileak itzulitako testua ahoskatu dezake; itzulitako testuko esaldi edo hitzak jatorrizko testuko zeini dagozkion nabarmendu ddezake, edota hitz batentzako hiztegi arrunt moduan erabili daiteke. “Hauteman hizkuntza” aukeratzen bada, jatorrizko testu bat zein hizkuntza den detekta dezake automatikoki.
Web-interfazean, erabiltzaileek ordezko itzulpenak iradoki ditzakete, teknizismoetarako adibidez, edo erroreak zuzendu, non zuzenketa hauek etorkizuneko itzulpen-prozesuko eguneraketan ezarriko diren. Erabiltzaile batek URL bat sartzen badu jatorrizko testuan, Itzultzaileak webguneko itzulpen automatikoko testuan ere hiperesteka bat sortuko du. Zenbait hizkuntzatarako, testua sartzerakoan hainbat aukera daude: teklatu bidez, eskuz idatzitako testua antzemateko algoritmoa duen taula bat erabiliz, edo mikrofono baten bidez ahotsaren ezagupena erabiliz.[3]
Google Translate gehigarri moduan dago erabilgarri nabigatzaile batzuetan, horrela erabiltzaileak erraz itzul ditzake bisitatzen dirtuen guneetako testua ere.
Badaude Firefoxeko gehigarriak Google Translate erabiltzeko, itzulpen zerbitzuaren komandoak aukeratzea baimentzen dutenak.[4][5] Gainera, badaude "Google Gadget" batzuk Google Translate erabiltzen dutena iGoogle edo beste web gune batzuekin integratzeko.
Google Chrome nabigatzailerako luzapen bat ere badago,[6] hau 2010eko otsailean integratu zen nabigatzailean, horrela kontsultatzen diren guneak automatikoki itzul daitezke.[7][8]
90 hizkuntzekin baino gehiagorekin da bateragarria aplikazioa eta hainbat modutako itzulpena onartzen du: irudi bateko testu batetik oinarrituz 37 hizkuntzatara itzul dezake, ahotsaz abiatuz 32 hizkuntzetara eta denbora errealeko bide batetik abiatuz 27 hizkuntzetara.[9]
Elkarrizketa modua erabiltzaileak beste pertsona batekin eta beste hizkuntza batean modu erosoan komunikatzeko aukera ematen duen interfaze bat da. Interfaze hau ez dago hizkuntza guztietarako erabilgarri.[10]
“Kamera bidezko sarrera” funtzionalitateak testu baten argazkia ateratzeko aukera ematen die erabiltzaileei, argazki honetatik abiatuz, Google-ko itzultzaileak testua ezagutzen du, karaktereen ezagutze optikoko teknologia erabiliz, eta testua aukeratutako hizkuntzara itzultzen du. Kamera bidezko sarrera ez dago hizkuntza guztietarako erabilgarri.
Aplikazio honek testua denbora errealean itzultzeko kapazitatea du gailu mugikorren kamera erabiliz eta Google-ko “Word Lens”[11] aplikazioaren bidez. Bideoen denbora errealeko (errealitate areagotua) itzulpenen abiadura eta kalitatea hobetzea lortu zen neurona-sareak erabiliz.[12][13]
Google-ko itzultzailea Android sistema eragilea duten erabiltzaile guztiek deskargatu dezakete guztiz dohainik, Nabigatzaileko bertsioa bezala funtzionatzen du, baina bi oinarrizko aukera eskaintzen ditu: “SMS itzulpena” eta “Historia”.
Nabigatzailearen bertsioa bezala, 90 hizkuntzetan baino gehiagorekin dago erabilgarri, hala ere, ahots bidezko itzulpenak bakarrik 15 hizkuntzetan da erabilgarri.[14] Google Play bidez deskargatu daiteke eta Android 2.1 bertsioa edo berriagoren bat dutenek erabil dezakete.[15] Mugikorreko kamera erabiliz, topatzen diren testuak itzultzeko gai da. Gainera, elkarrizketa modua erabil daiteke, ahotsaren bidez, bi hizkuntza ezberdinetan hitz egiten duten bi pertsona elkar uler daitezen.[16]
Badago HTML5 Google-ko itzultzaileko web aplikazio bat iOS-erako, iPhone, iPod Touch eta iOS erabiltzaileentzat. Egungo Google-ko itzultzaileko aplikazioa iPhone, iPad eta iPod Touch-ekin dago bateragarri. Honek ahozko sarrera onartzen du 15 hizkuntzetan eta hitz edo esaldi bat itzul dezake 50 hizkuntza baino gehiagotan. Sistemak testuzko itzulpena ahoskatzeko aukera ematen du 23 hizkuntzetan.[17]
2011ko maiatzean, Google-k iragarri zuen software garatzaileentzako Google-ko itzultzailearen APIa zaharkituta zegoela eta urte bereko abenduaren 1ean funtzionatzeari utziko zuela jakinarazi zuten, oso garestia zelako.[18][19] Hainbat webguneetan API hau asko erabiltzen zenez zenbait garatzaileek Google enpresa kritikatu zuten, Google-ko APIak beraien produktuetarako bideragarriak ez zirela esanez.[20][21] Hori dela eta, 2011ko Ekainean Google-k jakinarazi zuen APIa eskuragarri jarraituko zuela, baina ordaineko zerbitzuarekin.[18][22]
Sistema neuronala
Itzulpen automatiko neuronalean oinarritutako dagoen GNMT bertsio berri bat hasi zen ezartzen 2016an. Teknologia berri hori azken lau urteetan Itzulpen sistema guztietan ari da gailentzen. Ikasketa-sakonean, semantika distribuzionalean, neurona-sare errekurrenteetan eta epe laburreko memoria luzeetan oinarrituta daude. itzultzaile automatiko horri dinamikoki hobetzeko aukera emateko intentzioarekin.
GNMT hasieran zortzi hizkuntzetarako bakarrik erabil zitekeen: ingelesa, txinera,frantsesa, alemana, japoniera, korearra, portugesa, espaniera eta tukiera. 2017ko martxoan beste hauek gehitu zituzten: hindi, errusiera eta vietnamera. 2017ko apirilaz geroztik, asiako beste 9 hizkuntza gehiago.
Sistema estatistikoa (2006-2016)
2006tik 2016ra bitarte Google Translate-k erabili zuen programak ez zituen erregela gramatikalak erabiltzen, izan ere, bere algoritmoa analisi estatistikoetan oinarritzen zen ordura arte erabltzen ziren erregela gramatikal tradizionalen analisiaren ordez. Sistema haren jatorrizko sortzailea, Franz Josef Och, erregeletan oinarrituta dauden algoritmoen eraginkortasuna gaitzetsi zituen, ikuspuntu estatistikoetan oinarritutako sistemen errendimendu hobekuntza azpimarratuz.[23] Google-ko itzultzaile hura estatistiken oinarritutako itzulpen automatikoa deitutako metodo batean oinarritzen zen, konkretuki 2003 urtean DARPA itzulpen automatikoaren abiaduraren lehiaketan irabazi zuen Och-ek egindako ikerketaren emaitzak. Och-ek Google-ko itzulpen automatiko taldearen buru izan zen 2014ko uztaila arte non enpresa utzi zuen Human Logenvity enpresara batzeko.[24]
Googleko itzultzailearen barnealdeko funtzionamendua ez da zuzenean hizkuntza batetik bestera itzultzea (I1 → I2). Maiz iturburu-hizkuntzazko testua ingelesera itzultzen du eta gero ingelesetik helburu-hizkuntzara (I1 → EN → I2).[25][26][27] Hala ere, ingelesa anbiguoa denez eta testuinguruaren mende dagoenez, giza-hizkuntza guztiak bezala, metodo horrek itzulpenean akatsak ekar ditzake. Adibidez, vous hitzaren itzulpena frantsesetik errusiera honelako zerbait izango zen: vous → you → ты edo Bы/вы. Google-k bitarteko lengoaia artifizial bat erabiliko balu orduan honelakoa izango zen: vous → you → Bы/вы edo tu → thou → ты.[28] Google itzultzaileak itzultzen zuenean milioika dokumentuetan patroiak bilatzen ditu itzulpen hoberena zein den erabakitzeko. Gizakiak itzulitako dokumentuetan patroiak detektatuz, sistemak erabaki adimenduak hartzen zituen itzulpen egokienari buruz. Badaude hizkuntzak ez dutenak Googleko itzulpen zuzena ingelesetik edo ingelesera. Hizkuntza hauek bitarteko hizkuntza baten bidez itzultzen dira (nahi den hizkuntzarekin estuki erlazionatuta dagoena baino gehiago hitz egiten dena), geroago ingelesetik pasatzeko (segidako hiru itzulpen barneratzen duen prozesu batean):[29]
Och-en arabera, hizkuntza pare berri baterako erabilgarri den itzulpen sistema automatiko estatistiko bat garatzeko oinarri sendo bat elebiduna den testu corpus bat edukitzea da,150-200 milioi arteko hitzekin, eta bi corpus elebakar, bakoitzak mila miloi hitz baino gehiagokoak.
Honela, datu hauek erabiliz, posiblea izango da eredu estatistikoak erabiltzea hizkuntza horien arteko itzulpenak egiteko. Datu linguistiko kopuru izugarri hau lortzeko, Google erabiltzen du, adibidez, Nazio Batuen dokumentu eta txostenak.[30] Normalean ONUk bere dokumentu eta erregistroak ONUren sei hizkuntza ofizialetan, honek 6 hizkuntza horien testuzko corpus handia sortuz.
Google-ko itzultzailea itzulpen bat osatzen duenean, ehunka milioi dokumentuetan patroiak bilatzen ditu honela itzulpen hoberena bilatzeari lagunduz. Patroi hauek gizakiak itzulitako dokumentuen gainean detektatzen dira, honekin Google-ko itzultzaileak apustu adimenduak egiten ditu (adimen artifiziala erabiliz) itzulpen egoki bat izan behar duenaz. 2007ko urria baino lehenago, arabiera, txinera eta errusiera ez ziren hizkuntzentzako, Google-ko itzultzaileak SYSTRAN erabiltzen zuen, Babel Fish bezalako beste on-line itzulpen zerbitzuetan itzulpenak egiteko erabiltzen zen software motorra. Baina 2007ko urriaz geroztik, Google-ko itzultzaileak itzulpen automatiko estatistikoan oinarritutako bere teknologia patentatua erabiltzen du.[31][32]
Google-ko itzultzaileak bere mugak ditu, doako zerbitzua denez paragrafo kopurua eta itzul daitezkeen termino teknikoak mugaturik daude. Erabilgarria da testu baten eduki orokorra zein den jakiteko, hala ere ez ditu beti itzulpen perfektuak egiten eta batzuetan itzuli nahi den hitza errepikatzen du emaitza moduan. Google-ko itzultzailea zenbait hizkuntzetan dauden aldiak ezberdintzen saiatzen da, baina askotan pertsona batek itzuliz gero gertatuko ez liratekeen zenbait errore egiten ditu. Ez du subjuntiboa ezagutzen.[33] Beste aldetik, bigarren pertsonaren izenordaina (zu) maiz aukeratzen da testuingurua eta ondo erabilia dagoen antzeman gabe.[34]
Hizkuntza batzuk beste batzuk baino emaitza hobeak ematen dituzte.Google-ko itzultzailea lan egokia egiten du Ingelesetik bukaerako edo jatorrizko hizkuntza Europar Batasunean dagoen hizkuntza bat denean, EB-ko parlamentuak dokumentu kopuru izugarria itzuli duelako eta sistemak hauetara sarbidea du. 2010ean egin zen analisi baten arabera, frantsesetik ingeleserako itzulpenak oso zehatzak[35] ziren eta 2011 eta 2012 urteetan egindako beste analisi batzuk erakutsi zuten italieratik ingeleserako itzulpena ere zehatzak zirela.[36] Jatorrizko testua motza baldin bada, erregeletan oinarritutako itzulpenak askotan hobeto egiten dute lan, adibidez, txineratik ingelesera itzultzean hau asko nabarmentzen da.[35] Normalean itzulpenak editatu daitezke, hala ere, txineran hau ezin daiteke egin, karaktereen multzo arbitrario bat editatu behar da, zeinak akatsak sortzen ditu.
Hizkuntza batzuetan idatzitako testuak, greziera edo arabiera adibidez, latindar alfabetoan idatzitako baliokide fonetikoekin era automatikoan itzul daitezke literalki. Google-ko itzultzailearen nabigatzaileko bertsioak japoniarrei fonetikoki irakurtzeko aukera ematen die ingelesezko bihurketan, aukera hau ez dago API bertsioan. Ezagunenak diren hizkuntza askotan, sistemak testua ahots bihurtzeko funtzioa bat du, honek dozena bat hitzeko testu bat hizkuntza horretan irakurtzeko aukera ematen du. Hizkuntza hauetan guztietan erabiltzen den kutsua eskualdearen araberakoa da, adibidez, munduko leku batzuetan Ameriketako ingeleseko kutsua erabiltzen da eta beste batzuetan britainiar ingelesa. Oso zabalduak ez dauden hizkuntzetarako kode irekiko ahots sintetizatzaile bat erabiltzen da (eSpeak), baina robot batek sortzen duen ahotsa batzuetan ulertzeko zaila izan daiteke.
Paradigma neuronalaren ekarriarekin 2017z geroztik izugarrizko hobekuntza nabaritu zen hizkuntza nagusienen arteko itzultzaile automatikoetan. Geroxeago, eta arin, euskal munduko ikerkuntza komunitatea gai izan zen euskaratik eta euskararako itzultzaile neuronalak mundu mailako artearen egoeraren pare jartzeko.
2015ean hasi zen euskararako itzulpen neuronala aztertzen TADEEP proiektuan.[37] Ordurako Deepl itzultzaileak kalitatezko emaitzak ematen zituen 10 hizkuntzatan baina euskara ez zegoen horien artean. Bi urte geroago lehenengo emaitza bikainak lortuta, 2017an lehen demoa publikoki eskura zegoen. 2017an bertan, hainbat agente (Ixa Taldea, Elhuyar, Vicomtech, Ametzagaña, Mondragon Lingua...) batera, MODELA izeneko proiektua abiatu zen.[38] Beste urtebeteko epean, 2018an MODELA itzultzailea plazaratu zen, Interneten publiko orokorrerako euskarazko itzulpen neuronala eskaintzen zuen lehen zerbitzua.
Abiada bizian mugitzen zen arlo honetan, geroago gutxienez beste hiru itzultzaile neuronal gehiago plazaratu ziren. Horien arteko diferentzia nagusia itzultzaile bakoitzak erabiltzen duen corpusa da (corpus = milioika esaldi bi hizkuntzatan), baita itzultzeko zerbitzuan onartzen duten hitz-kopuru maximoa ere (konputagailu ahaltsu eta garestiak erabili behar dira horretan). Hauek ziren 2020ko hasieran eskaintzen ziren euskararako itzultzaile neuronalak:
Google Translatek hizkuntza honekin lan egiten du.
Hizkuntza | WordNet | Lizentzia |
---|---|---|
Albaniera | Albanet | CC-BY 3.0/GPL 3 |
Arabiera | Arabic Wordnet | |
Katalanera | Multilingual Central Repository | CC-BY-3.0 |
Txinera | Chinese Wordnet | Wordnet |
Daniera | Dannet | No Wordnet |
Gaztelera | Multilingual Central Repository | CC-BY-3.0 |
Finlandiera | FinnWordnet | Wordnet |
Frantsera | WOLF (WOrdnet Libre du Français) | CeCILL-C |
Galliziera | Multilingual Central Repository | CC-BY-3.0 |
Hebreerao | Hebrew Wordnet | Wordnet |
Hindia | IIT Bombay Wordnet | Indo Wordnet |
Indonesiera | Wordnet Bahasa | MIT |
Ingelesa | Princeton Wordnet | Wordnet |
Italiera | MultiWordnet | CC-BY-3.0 |
Japoniera | Japanese Wordnet | Wordnet |
Javanesera | Javanese Wordnet | Wordnet |
Malayera | Wordnet Bahasa | MIT |
Norbegiera | Norwegian Wordnet | Wordnet |
Persiera | Persian Wordnet | Free to Use |
Poloniera | plWordnet | Wordnet |
Portuguesera | OpenWN-PT | CC-BY-SA-3.0 |
Thailandiera | Thai Wordnet | Wordnet |
Itzulpen-zerbitzua atera eta denbora gutxira, Googlek ingeles-arabiera eta ingelesa-txinera itzulpenean lehiaketa internazionala irabazi zuen.[44]
Google-ko itzultzaileak kointzidentzia estatistikoak erabiltzearen ondorioz, batzuetan itzultzen den testuan akatsa nabariak eta sentsu gabeko esaldiak ager daitezke,[45] antzeko hitzak erabiliz baina baliokideak ez direnak emaitza hizkuntzan,[46] esaldiaren esanahia guztiz kontrakoa izatera iritsiz.
Google-ko itzultzailearen komunitatea Google-ko itzultzailearen zerbitzua hobetzen laguntzea helburua duen plataforma bat da. Bolondresak bost hizkuntzataraino aukeratu dezakete itzulpena hobetzen laguntzeko. Erabiltzaileak itzulitako esaldiak egiaztatu dezakete eta bere hizkuntzan esaldiak itzuli ingelesetik edo ingelesera, honela esaldi korapilatsu eta zailen itzulpenaren zehaztasuna hobetuz.[47]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.