Najlepsze pytania
Chronologia
Czat
Perspektywa
Tłumacz Google
usługa przekładu maszynowego Z Wikipedii, wolnej encyklopedii
Remove ads
Tłumacz Google (ang. Google Translate) – darmowy serwis internetowy Google umożliwiający tłumaczenie tekstu, plików, stron internetowych, mowy i zdjęć na różne języki.
Remove ads
Historia
W 2001 w wyszukiwarce Google wprowadzono funkcję tłumaczenia znalezionych stron internetowych dla anglojęzycznych użytkowników[1]. Do wyszukiwarki dodano także podstronę Language Tools (narzędzia językowe), na której można było tłumaczyć podaną przez siebie stronę[2] i tekst[3]. W 2006 te dwa narzędzia zyskały własną subdomenę[4], tuż po implementacji pierwszej pary języków korzystających ze statystycznego tłumaczenia maszynowego (angielski-arabski)[potrzebny przypis].
Rok 2006 podawany jest jako data uruchomienia Tłumacza Google[5][6][7]. 8 maja 2008 dodano język polski i możliwość tłumaczenia między dwoma dowolnymi językami z list[potrzebny przypis]. W 2013 z serwisu korzystało codziennie 200 milionów osób[8]. W 2016 ponad 500 milionów osób korzystało z serwisu – tłumacząc ponad 100 miliardów słów dziennie[5]. W marcu 2017 język polski zaczął opierać się na systemie GNMT , który ulepszył jakość tłumaczeń[potrzebny przypis].
Po 2020 roku, serwis przeszedł na korzystanie z architektury kodera transformatora i dekodera RNN[9].
Remove ads
Funkcje
Podsumowanie
Perspektywa
Tłumacz Google pozwala na tłumaczenie tekstu wieloma metodami. Wśród nich są:
- tłumaczenie tekstu – tłumaczy tekst wprowadzony za pomocą klawiatury (fizycznej lub wirtualnej, w tym przez pismo odręczne[10]) bądź głosowo[11].
- tłumaczenie dokumentów – wersja na komputer pozwala tłumaczyć pliki[12].
- tłumaczenie stron – Tłumacz Google pozwala na tłumaczenie stron internetowych[12].
- tłumaczenie zdjęć – tłumaczy tekst wykryty w obrazie z aparatu lub zapisanym zdjęciu. Funkcja dostępna wyłącznie w aplikacji mobilnej[13].
- „dotknij, aby przetłumaczyć” – tłumaczenie wybranego tekstu z innych aplikacji. Funkcja dostępna wyłącznie w aplikacji mobilnej[14].
- konwersacja – pozwala na tłumaczenie dwujęzycznego dialogu. Funkcja dostępna wyłącznie w aplikacji mobilnej[15].
- transkrypcja – zamiana mowy na tekst. Funkcja dostępna wyłącznie w aplikacji mobilnej[16].
Serwis natychmiastowo tłumaczy wyrażenia podczas wpisywania i potrafi wykryć ich język. Wpisując wyraz lub wyrażenie, translator działa niczym słownik, oferując kilka propozycji[potrzebny przypis]. Po zalogowaniu się na konto Google, serwis pozwala na zapisanie tłumaczeń na później[17] i przegląd historii[18].
W przypadku języków, które nie posługują się pismem łacińskim, dostępna jest automatyczna transliteracja. Do tego dostępne są edytory wprowadzania znaków (IME) dla większości tych języków[potrzebny przypis].
Otrzymane tłumaczenia można odsłuchać dzięki syntezie mowy – większość należy do WaveNet[kto?] od Google (głosy brzmiące naturalnie), a reszta – do eSpeak (głosy brzmiące syntetycznie). Głosy różnią się w zależności od geolokalizacji: angielski głos będzie miał akcent brytyjski w Europie, Afryce i Azji Południowej, australijski w Australii i Nowej Zelandii, indyjski w Indiach, nigeryjski w Nigerii, a amerykański w reszcie świata. Podobnie z hiszpańskim (amerykański na kontynencie, kastylijski poza nim), portugalskim (akcent europejski tylko w Portugalii, poza nią – brazylijski) i francuskim (akcent Quebecu tylko w Kanadzie, poza nią – europejski)[potrzebny przypis].
Tłumacz Google jest dostępny jako wtyczka w niektórych przeglądarkach[19], a w Chrome jest zintegrowana domyślnie[20].

brytyjski
amerykański
australijski
indyjski
nigeryjski
Dostępne języki
Aplikacja mobilna
Aplikację mobilną wydano najpierw na system Android w styczniu 2010, a 8 lutego 2011[38] na iOS. Oprócz tego, istniała wcześniejsza aplikacja HTML dla urządzeń z iOS, powstała w sierpniu 2008[39]. Poza podstawowymi funkcjami, aplikacja pozwala na użytkowanie w trybie offline, tłumaczenie napisów z aparatu oraz plików graficznych[40] (dzięki Word Lens[41]), wykonywanie tłumaczeń w innych aplikacjach, oraz tłumaczenie ludzkiej mowy na żywo w trybie konwersacji[42] lub w trybie transkrypcji[16].
API
Google oferuje swoje API dla Tłumacza za opłatą[43]. 26 maja 2011 ogłoszono zakończenie poprzedniej, darmowej oferty (z terminem 1 grudnia[44][45][46]), lecz ze względu na dużą popularność API do tego nie doszło[47].
Społeczność
Między latami 2013[48] a 2024[49], Google pozwalało wolontariuszom (crowdsourcing) poprzez aplikację Google Crowdsource[50][51] lub opcję „Społeczność” na stronie internetowej[52][53][54][55][56]. Użytkownicy mogli tłumaczyć podane zdania, oceniać istniejące tłumaczenia, a w przypadku języków BETA , testować wczesną wersję translatora.
Remove ads
Metody tłumaczenia
Podsumowanie
Perspektywa
Od listopada 2016, Google korzysta z GNMT[24][57], a wcześniej – z mechanizmu statycznego tłumaczenia maszynowego[58] i SYSTRAN[potrzebny przypis].
GNMT
Google Neural Machine Translation (GNMT) opracowano w celu zwiększenia płynności i dokładności serwisu. System ten wykorzystuje dużą, sztuczną sieć neuronową (dokładniej sieć długiej pamięci krótkoterminowej[59][60][61][62]) zdolną do deep learningu. Dzięki wykorzystaniu metody tłumaczenia maszynowego opartą na próbkach (EBMT ), w której system „uczy się z milionów przykładów”, GNMT pozwala poprawić jakość tłumaczeń[63]. Według badaczy Google technika ta umożliwia przekładanie „całych zdań naraz, a nie kawałek po kawałku. Zwraca uwagę na szerszy kontekst, aby znaleźć najbardziej odpowiednie tłumaczenia, które następnie przestawia i dostosowuje tak, aby przypominały ludzką mowę z poprawną gramatyką”. Zamierzona przez GNMT architektura została zaimplementowana dla wszystkich języków obsługiwanych przez serwis[64][65]. Dzięki kompleksowej strukturze, „system z czasem uczy się tworzyć lepsze, bardziej naturalne tłumaczenia”. Sieć GNMT jest zdolna do międzyjęzykowego tłumaczenia maszynowego, która koduje „semantykę zdania, niż zapamiętując frazę do tłumaczenia”, a system nie wymyślił własnego języka uniwersalnego, ale korzysta z „podobieństw znalezionych między wieloma językami”[66]. GNMT zostało wypuszczone dla polskiego w marcu 2017[67].
GNMT umożliwia tłumaczenie bezpośrednio z jednego języka na inny (L1 → L2), co jest poprawą względem wcześniejszych wersji, które najpierw tłumaczyły na język angielski, a dopiero potem na język docelowy (L1 → EN → L2). Jest to możliwe dzięki „tłumaczeniu zero-shot”[68], które dotyczy par języków, których system nie oferował bezpośrednio (np. z japońskiego na koreański)[potrzebny przypis].
Statystyczne tłumaczenia maszynowe i SYSTRAN
Przed październikiem 2007 tłumaczenia między językami innymi niż arabski, chiński i rosyjski działały w oparciu o SYSTRAN – silnik oprogramowania, który był stosowany np. w Babel Fish. Od tego czasu, do implementacji GNMT Tłumacz Google używał zastrzeżonej technologii wewnętrznej opartej na statystycznym tłumaczeniu maszynowym[69][70][58].
System ten nie stosował się do zasad gramatycznych – jego algorytmy były oparte na analizie statystycznej, a nie na tradycyjnej analizie opartej na regułach gramatyki. Oryginalny twórca systemu, Franz Josef Och, skrytykował skuteczność algorytmów opartych na regułach, w zamian popierając metody statystyczne. Oryginalne wersje serwisu wykorzystywały metodę zwaną statystycznym tłumaczeniem maszynowym, opartą na badaniach Ocha, zwycięzcy konkursu DARPA na tłumaczenie maszynowe w 2003 roku. Och był szefem grupy tłumaczeń maszynowych Google, aż do momentu dołączenia do Human Longevity, Inc. w lipcu 2014[71].
Według Ocha solidna podstawa do stworzenia użytecznego systemu statystycznego dla nowej pary języków od podstaw powinna składać się z dwujęzycznego korpusu tekstowego (lub kolekcji równoległej) o objętości ponad 150–200 milionów słów i dwóch jednojęzycznych korpusów, z których każdy powinien zawierać ponad miliarda słów. Modele statystyczne z tych danych byłyby następnie wykorzystywane do tłumaczenia między językami. Do zebrania tak ogromnej ilości danych językowych Google wykorzystał dokumenty i transkrypty od Organizacji Narodów Zjednoczonych i Parlamentu Europejskiego[72][73]. ONZ zazwyczaj publikuje dokumenty w sześciu oficjalnych językach, co ułatwiło zebranie ogromnego korpusu[potrzebny przypis].
Tłumacz Google nie tłumaczył bezpośrednio z jednego języka na inny (L1 → L2). W zamian, w większości przypadków treści były tłumaczone najpierw na angielski, a dopiero potem na język docelowy (L1 → EN → L2)[potrzebny przypis].
Przy generowaniu tłumaczenia Tłumacz Google szukał wzorców w setkach milionów dokumentów, które zostały już przełożone przez ludzkich tłumaczy, aby znaleźć najtrafniejsze odwzorowanie. Wykrywszy je, Tłumacz mógł w przemyślany sposób domyślić się, jak powinno brzmieć poprawne tłumaczenie[potrzebny przypis].
Remove ads
Wykorzystane licencje WordNet
Remove ads
Dokładność
Podsumowanie
Perspektywa
Tłumacz Google nie jest tak dokładny, jak tłumaczenie ludzkie. Jeżeli tekst jest krótki[75], poprawnie sformułowany i używa formalnego słownictwa (w szczególności kiedy oba języki mają duże korpusy językowe[76]), wynik jest podobny do satysfakcjonującego[77], lecz w im mniejszym stopniu spełnia te kryteria, tym wynik będzie gorszy. Ludzka ocena wykazała, że tłumaczenia przekazywały zamysł powyżej 50% tylko dla 35 języków z 102[78]. W przypadku par bez angielskiego po którejkolwiek stronie, liczba ta wynosi około 1%. Badania z 2011 pokazały, że Google uzyskał wynik trochę większy niż na zaliczenie egzaminu z angielskiego na UCLA[79]. Pod względem formalności, spójności, długości oraz struktury zdań wyniki Tłumacza są podobne względem tłumaczeń ludzkich[80]. Podczas badań Google z 2018, użytkownicy języków mieli ocenić tłumaczenia w skali od 0 do 6 – średnia wyniosła 5,43[81].
Jakość tłumaczeń różni się między językami ze względu na powszechność języków i źródeł na ich temat. Wiele języków azjatyckich i afrykańskich (z wyjątkami np. afrikaans i chińskiego) wypada gorzej w porównaniu z tymi europejskimi, a tych rdzennych z Oceanii i Ameryk nie ma prawie wcale[potrzebny przypis].
Działając jako słownik, Tłumacz często popełniał błędy względem słów polisemicznych – 100 najpopularniejszych słów w korpusie słownika Oxford ma średnio 15 znaczeń[82], a większość znanych wyrazów ma ich co najmniej 2. Ponieważ translator opierał się na tłumaczeniu statystycznym, a tłumaczenia korzystały z angielskiego jako bazy, w niektórych przypadkach oznaczało to błędne tłumaczenia. Jeżeli w bazie nie ma wyrazu, serwis jest w stanie wymyślić dla niego tłumaczenie[83].
Remove ads
Ograniczenia
Tłumacz Google, jak inne serwisy tłumaczeniowe, posiada ograniczenia. Serwis ogranicza liczbę znaków (5000), które mogą być jednorazowo przetłumaczone, lecz można to obejść, tłumacząc tekst w pliku. O ile serwis pozwala użytkownikowi zrozumieć tekst, często tłumaczy słowo-do-słowa, co czyni tłumaczenia niedokładnymi. Pod względem gramatycznym, serwis zmaga się z rozróżnianiem aspektu dokonanego i niedokonanego w językach romańskich, co przyczynia się do błędów, których by nie napotkał ludzki tłumacz. Translator borykał się także z trybem łączącym[84] oraz francuskim tu i vous (w angielskim oba tłumaczy się jako you)[85]. Tłumacz ma problemy z rozumieniem polisemii i związków frazeologicznych[86].
Remove ads
Odbiór i wykorzystanie w praktyce
Tuż po wystartowaniu serwisu, wygrał on międzynarodowy turniej w tłumaczeniu maszynowym z angielskiego na chiński i arabski[87].
Wykorzystanie w sądzie
W 2017 Tłumacz Google został użyty podczas rozprawy sądowej w Teesside Magistrates’ Court, ponieważ nie można było zarezerwować tłumacza dla oskarżonego mówiącego po chińsku[88].
Zobacz też
Uwagi
Przypisy
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads