Google Terjemahan
perusahaan asal Amerika Serikat Dari Wikipedia, ensiklopedia bebas
Google Terjemahan (bahasa Inggris: Google Translate) adalah layanan penerjemahan statistik dan mesin neural multibahasa bahasa yang dikembangkan oleh Google, untuk menerjemahkan teks dan situs web dari satu bahasa ke bahasa lain. Google Terjemahan menawarkan antarmuka situs web, aplikasi seluler untuk Android dan iOS, dan antarmuka pemrograman aplikasi yang membantu pengembang membangun ekstensi peramban dan aplikasi perangkat lunak. Pada April 2020, Google Terjemahan menyediakan 109 bahasa di berbagai tingkatan dan hingga April 2016, mengklaim lebih dari 500 juta total pengguna, dengan lebih dari 100 miliar kata diterjemahkan setiap hari.[1]
Google Translate | |
---|---|
![]() | |
![]() Beranda Google Terjemahan | |
URL | translate |
Tipe | Statistik dan mesin neural |
Bersifat komersial? | Ya |
Pendaftaran | Opsional |
Bahasa | 109 bahasa, lihat dibawah |
Pengguna | Lebih dari 500 juta pengguna setiap hari |
Pemilik | |
Pembuat | |
Pengembang web | |
Berdiri sejak | 28 April 2006 | (Sebagai mesin terjemahan statistik)15 November 2016 (sebagai mesin terjemahan neural)
Status | Aktif |
Blog resmi | https://blog.google/products/translate |
Diluncurkan pada April 2006 sebagai layanan mesin terjemahan statistik, layanan ini menggunakan dokumen dan transkrip PBB dan Parlemen Eropa untuk mengumpulkan data-data linguistik. Alih-alih menerjemahkan bahasa secara langsung, pertama-tama menerjemahkan teks ke bahasa Inggris dan kemudian berporos ke bahasa target di sebagian besar kombinasi bahasa yang ditempatkan di barisnya,[2] dengan beberapa pengecualian termasuk Catalan-Spanyol.[3] Selama terjemahan, layanan ini mencari pola dalam jutaan dokumen untuk membantu memutuskan kata mana yang akan dipilih dan bagaimana mengaturnya dalam bahasa target.
Sejarah
Ringkasan
Perspektif
Google Translate adalah layanan terjemahan komplementer yang dikembangkan oleh Google pada bulan April 2006.[4] Layanan ini menerjemahkan berbagai bentuk teks dan media seperti kata, frasa, dan halaman web.
Awalnya Google Translate dirilis sebagai layanan terjemahan mesin statistik.[4] Menerjemahkan teks yang diperlukan ke dalam bahasa Inggris sebelum menerjemahkan ke dalam bahasa yang dipilih adalah langkah wajib yang harus diambil. Karena SMT menggunakan algoritma prediksi untuk menerjemahkan teks, ia memiliki akurasi tata bahasa yang buruk. Namun, Google pada awalnya tidak mempekerjakan para ahli untuk mengatasi keterbatasan ini karena sifat bahasa yang terus berkembang.
Pada Januari 2010, Google telah memperkenalkan aplikasi Android dan versi iOS pada Februari 2011 yang berfungsi sebagai penerjemah pribadi portabel.[4] Pada Februari 2010, itu diintegrasikan ke dalam peramban seperti Chrome dan dapat mengucapkan teks, secara otomatis mengenali kata-kata dalam gambar dan menemukan teks dan bahasa yang tidak dikenal.
Pada Mei 2014, Google mengakuisisi Word Lens untuk meningkatkan kualitas terjemahan visual dan suara.[5] Google Translate dapat memindai teks atau gambar denggan perangkat Anda dan menerjemahkannya secara instan. Selain itu, sistem secara otomatis mengidentifikasi bahasa asing dan menerjemahkan ucapan tanpa mengharuskan individu untuk mengetuk tombol mikrofon setiap kali terjemahan ucapan diperlukan.[5]
Pada November 2016, Google mengubah metode penerjemahannya ke sistem yang disebut terjemahan mesin saraf.[6] Sistem ini menggunakan teknik pembelajaran mendalam untuk menerjemahkan seluruh kalimat pada satu waktu, yang telah diukur agar lebih akurat antara bahasa Inggris dan Prancis, Jerman, Spanyol, dan Cina.[7] Tidak ada hasil pengukuran yang disediakan oleh peneliti Google untuk GNMT dari bahasa Inggris ke bahasa lain, bahasa lain ke bahasa Inggris, atau antara pasangan bahasa yang tidak termasuk bahasa Inggris. Pada 2018, layanan ini menerjemahkan lebih dari 100 miliar kata sehari.[6]
Fungsi alat
Ringkasan
Perspektif
Google Translate dapat menerjemahkan berbagai bentuk teks dan media, yang mencakup teks, ucapan, dan teks di dalam gambar diam atau gambar bergerak. Secara khusus, fungsinya meliputi:
- Terjemahan Kata-kata Tertulis: suatu fungsi yang menerjemahkan kata-kata atau teks tertulis ke bahasa asing.[8]
- Penerjemahan Situs Web: fungsi yang menerjemahkan seluruh halaman web ke bahasa yang dipilih.[9]
- Penerjemahan Dokumen: fungsi yang menerjemahkan dokumen yang diunggah oleh pengguna ke bahasa yang dipilih. Dokumen-dokumen harus dalam bentuk: .doc, .docx, .odf, .pdf, .pptx, .ps, .rtf, .txt, .xls, .xlsx.[9]
- Terjemahan Bicara: suatu fungsi yang secara instan menerjemahkan bahasa lisan ke dalam bahasa asing yang dipilih.[10]
- Terjemahan Aplikasi Seluler: pada tahun 2018, Google Translate telah memperkenalkan fitur barunya yang disebut “Ketuk untuk Menerjemahkan,” yang membuat terjemahan instan dapat diakses di dalam aplikasi apa pun tanpa keluar atau mengubahnya.[11]
- Penerjemahan Gambar: fungsi yang mengidentifikasi teks dalam gambar yang diambil oleh pengguna dan menerjemahkan teks di layar secara instan dengan gambar.[12]
- Terjemahan Tulisan Tangan: suatu fungsi yang menerjemahkan bahasa yang ditulis tangan pada layar ponsel atau digambar pada keyboard virtual tanpa dukungan keyboard.[12]
Untuk sebagian besar fitur-fiturnya, Google Translate menyediakan pelafalan, kamus, dan mendengarkan terjemahan. Selain itu, Google Translate telah memperkenalkan aplikasi Translate-nya sendiri, sehingga terjemahan tersedia dengan ponsel dalam mode luring.[11]
Bahasa yang didukung
Ringkasan
Perspektif
109 bahasa berikut didukung oleh Google Translate pada April 2020.[13] Bahasa Mandarin (Sederhana) dan Bahasa Mandarin (Tradisional) merujuk pada dua sistem penulisan yang berbeda untuk bahasa yang sama, sehingga jumlah total sebenarnya bahasa dalam daftar adalah 108.
- Afrikaans
- Albanian
- Amhar
- Arab
- Armenian
- Azerbaijani
- Basque
- Belarusian
- Bengali
- Bosnia
- Bulgaria
- Burma
- Catalan
- Cebuano
- Chichewa
- Tionghoa (Sederhana)
- Tionghoa (Tradisional)
- Korsika
- Kroasia
- Ceska
- Denmark
- Belanda
- Inggris
- Esperanto
- Estonia
- Filipina
- Finlandia
- Perancis
- Galicia
- Georgia
- Jerman
- Yunani
- Gujarati
- Kreol Haiti
- Hausa
- Hawaii
- Ibrani
- Hindi
- Hmong
- Hungaria
- Islandia
- Igbo
- Indonesia
- Irlandia
- Italia
- Jepang
- Jawa
- Kanada
- Kazakh
- Khmer
- Kinyarwanda
- Korea
- Kurdi (Kurmanji)
- Kirgiz
- Laos
- Latin
- Latvia
- Lithuania
- Luksemburg
- Makedonia
- Malagasi
- Melayu
- Malayalam
- Malta
- Maori
- Marathi
- Mongolia
- Nepal
- Norwegia (Bokmål)
- Odia
- Pashto
- Persia
- Polandia
- Portugis
- Punjabi (Gurmukhi)
- Rumania
- Russia
- Samoa
- Skotlandia Gaelik
- Serbia
- Sesotho
- Shona
- Sindhi
- Sinhala
- Slovakia
- Slovenia
- Somali
- Spanyol
- Sunda
- Swahili
- Swedia
- Tajik
- Tamil
- Tatar
- Telugu
- Thai
- Turki
- Turkmen
- Ukrainia
- Urdu
- Uyghur
- Uzbek
- Vietnam
- Welsh
- West Frisian
- Xhosa
- Yiddi
- Yoruba
- Zulu
Sejarah
- Tahap ke-1
- Tahap ke-2
- Bahasa Inggris ke dan dari Portugis
- Tahap ke-3
- Bahasa Inggris ke dan dari Italia
- Tahap ke-4
- Tahap ke-5 (diluncurkan 28 April, 2006)[14]
- Bahasa Inggris ke dan dari Arab
- Tahap ke-6 (diluncurkan 16 Desember 2006)
- Bahasa Inggris ke dan dari Russia
- Tahap ke-7 (diluncurkan 9 Februari 2007)
- Bahasa Inggris ke dan dari Cina(Tradisional)
- Mandarin (Disederhanakan ke dan dari Tradisional)
- Tahap ke-8 (semua 25 pasangan bahasa menggunakan sistem terjemahan mesin Google) (diluncurkan 22 Oktober 2007)
- Tahap ke-9
- Bahasa Inggris ke dan dari Hindi
- Tahap 10 (pada tahap ini, terjemahan dapat dilakukan antara dua bahasa, menggunakan bahasa Inggris sebagai langkah perantara, jika diperlukan) (diluncurkan 8 Mei 2008)
- Tahap 11 (diluncurkan 25 September 2008)
- Tahap ke-12 (diluncurkan 30 Januari 2009)
- Tahap ke-13 (diluncurkan 19 Juni 2009)
- Tahap ke-14 (diluncurkan 24 Agustus 2009)
- Persia
- Tahap Beta selesai. Pengguna sekarang dapat memilih untuk membuat romanisasi ditulis untuk Belarusia, Bulgaria, Cina, Yunani, Hindi, Jepang, Korea, Rusia, Thailand, dan Ukraina. Untuk terjemahan dari bahasa Arab, Hindi dan Persia, pengguna dapat memasukkan transliterasi teks Latin dan teks akan ditransliterasikan ke skrip asli untuk bahasa-bahasa ini saat pengguna mengetik. Teks sekarang dapat dibaca oleh sebuah text-to-speechprogram dalam bahasa Inggris, Prancis, Jerman dan Italia.
- Tahap 16 (diluncurkan 30 Januari 2010)
- Haitian Creole
- Tahap 17 (diluncurkan April 2010)
- Program bicara diluncurkan in Hindi dan Spanyol.
- Tahap 18 (diluncurkan 5 Mei 2010)
- Program bicara diluncurkan dalam bahasa Afrika, Albania, Katalan, Cina (Mandarin), Kroasia, Ceko, Denmark, Belanda, Finlandia, Yunani, Hungaria, Islandia, Indonesia, Latvia, Makedonia, Norwegia, Polandia, Portugis, Rumania, Rusia, Serbia, Slovakia , Swahili, Swedia, Turki, Vietnam dan Welsh (berdasarkan eSpeak)[15]
- Tahap ke-19 (diluncurkan 13 Mei 2010)[16]
- Armenian
- Azerbaijani
- Basque
- Georgian
- Urdu
- Tahap ke-20 (diluncurkan Juni 2010)
- Menyediakan romanisasi untuk bahasa Arab.
- Tahap ke-21 (diluncurkan September 2010)
- Tahap 22 (diluncurkan Desember 2010)
- Romanisasi Arab dihapus.
- Periksa ejaan ditambahkan.
- Untuk beberapa bahasa, Google mengganti synthesizer text-to-speech dari suara robot eSpeak ke teknologi suara alami penutur asli yang dibuat oleh SVOX[18] (Cina, Ceko, Denmark, Belanda, Finlandia, Yunani, Hungaria, Norwegia, Polandia, Portugis, Rusia, Swedia, Turki), dan juga versi lama Prancis, Jerman, Italia, dan Spanyol; Latin menggunakan synthesizer yang sama dengan Italia.
- Program bicara diluncurkan dalam bahasa Arab, Jepang dan Korea.
- Tahap 23 (diluncurkan Januari 2011)
- Pilihan terjemahan berbeda untuk satu kata.
- Tahap 24 (diluncurkan Juni 2011)
- Tahap 25 (diluncurkan Juli 2011)
- Peringkat terjemahan diperkenalkan.
- Tahap 26 (diluncurkan Januari 2012)
- Synthesizer suara pria Belanda diganti dengan wanita.
- Elena oleh SVOX menggantikan suara Slovak eSpeak.
- Transliterasi Yiddish ditambahkan.
- Tahap 27 (diluncurkan Februari 2012)
- Tahap 28 (diluncurkan September 2012)
- Tahap 29 (diluncurkan Oktober 2012)
- Tahap 30 (diluncurkan Oktober 2012)
- Program bicara baru diluncurkan dalam bahasa Inggris.
- Tahap 31 (diluncurkan November 2012)
- Program bicara baru dalam bahasa Prancis, Jerman, Italia, Latin dan Spanyol.
- Tahap 32 (diluncurkan Maret 2013)
- Buku frasa ditambahkan.
- Tahap 33 (diluncurkan April 2013)
- Khmer
- Tahap 34 (diluncurkan Mei 2013)
- Tahap 35 (diluncurkan Mei 2013)
- 16 bahasa tambahan dapat digunakan dengan input kamera: Bulgaria, Catalan, Kroasia, Denmark, Estonia, Finlandia, Hungaria, Indonesia, Islandia, Latvia, Lituania, Norwegia, Rumania, Slovakia, Slovenia, dan Swedia.
- Tahap 36 (diluncurkan Desember 2013)
- Tahap ke-37 (diluncurkan Juni 2014)
- Definisi kata ditambahkan.
- Tahap ke-38 (diluncurkan Desember 2014)
- Tahap 39 (diluncurkan Oktober 2015)
- Terjemahan bahasa Arab dipulihkan.
- Tahap ke-40 (diluncurkan November 2015)
- Aurebesh
- Tahap ke-41 (diluncurkan Februari 2016)
- Tahap ke-42 (diluncurkan September 2016)
- Program bicara diluncurkan di Ukraina
- Tahap ke-43 (diluncurkan Desember 2016)
- Program bicara diluncurkan di Khmer dan Sinhala.
- Tahap ke-44 (diluncurkan Juni 2018)
- Program bicara diluncurkan di Burma, Malayalam, Marathi dan Telugu.
- Tahap ke-45 (diluncurkan September 2019)
- Program bicara diluncurkan di Gujarati, Kannada, dan Urdu.
- Tahap ke-46 (diluncurkan Februari 2020)
Bahasa dalam pengembangan
Bahasa-bahasa ini belum didukung oleh Google Translate, tetapi tersedia di Komunitas Terjemahan.[29]
Ketepatan
Ringkasan
Perspektif
Google Translate tidak selalu dapat diandalkan seperti terjemahan manusia. Ketika teks terstruktur dengan baik, ditulis menggunakan bahasa formal, dengan kalimat-kalimat sederhana, berkaitan dengan topik formal yang datanya cukup banyak, sering menghasilkan konversi yang mirip dengan terjemahan manusia antara bahasa Inggris dan sejumlah bahasa sumber daya tinggi.[30] Keakuratan menurun untuk bahasa-bahasa itu ketika lebih sedikit dari kondisi-kondisi itu berlaku, misalnya ketika panjang kalimat bertambah atau teks menggunakan bahasa yang akrab atau sastra. Untuk banyak bahasa lain vis-à-vis Bahasa Inggris, ini dapat menghasilkan inti teks dalam keadaan formal tersebut.[31] Evaluasi manusia dari bahasa Inggris ke 102 bahasa menunjukkan bahwa gagasan utama sebuah teks disampaikan lebih dari 50% dari waktu untuk 35 bahasa. Untuk 67 bahasa, hasil minimal yang dapat dipahami tidak tercapai 50% dari waktu atau lebih.[32]
Ketika digunakan sebagai kamus untuk menerjemahkan satu kata, Google Translate sangat tidak akurat karena harus menebak antara kata-kata polisemik. Di antara 100 kata teratas dalam bahasa Inggris, yang merupakan lebih dari 50% dari semua bahasa Inggris tertulis, kata rata-rata memiliki lebih dari 15 pengertian.[33] yang membuat kemungkinan terjemahan yang benar sekitar 15 hingga 1 jika setiap indra memetakan kata yang berbeda dalam bahasa target. Kata-kata bahasa Inggris yang paling umum memiliki setidaknya dua indera, yang menghasilkan peluang 50/50 dalam hal kemungkinan bahwa bahasa target menggunakan kata-kata yang berbeda untuk indra yang berbeda. Peluangnya mirip dari bahasa lain dengan bahasa Inggris.
Google Terjemahan membuat perkiraan statistik yang meningkatkan kemungkinan menghasilkan kata yang paling sering, dengan konsekuensi bahwa terjemahan yang akurat tidak akan diperoleh dalam kasus yang tidak sesuai dengan mayoritas atau kemunculan corpus pluralitas. Keakuratan prediksi satu kata belum diukur untuk bahasa apa pun. Karena hampir semua pasangan bahasa non-Inggris berporos melalui bahasa Inggris, peluang untuk mendapatkan terjemahan kata tunggal yang akurat dari satu bahasa non-Inggris dapat diperkirakan dengan mengalikan jumlah indera dalam bahasa sumber dengan jumlah indra masing-masing istilah dalam bahasa Inggris. Ketika Google Translate tidak memiliki kata dalam kosakata, itu membuat hasil sebagai bagian dari algoritma.[34]
Lisensi dan komponen open-source
Bahasa | WordNet | Lisensi |
---|---|---|
Albania | Albanet | CC-BY 3.0/GPL 3 |
Arab | Arabic Wordnet | CC-BY-SA 3 |
Catalan | Multilingual Central Repository | CC-BY-3.0 |
Cina | Chinese Wordnet | Wordnet |
Denmark | Dannet | Wordnet |
Inggris | Princeton Wordnet | Wordnet |
Finlandia | FinnWordnet | Wordnet |
Perancis | WOLF (WOrdnet Libre du Français) | CeCILL-C |
Galicia | Multilingual Central Repository | CC-BY-3.0 |
Hebrew | Hebrew Wordnet | Wordnet |
Hindi | IIT Bombay Wordnet | Indo Wordnet |
Indonesia | Wordnet Bahasa | MIT |
Italia | MultiWordnet | CC-BY-3.0 |
Jepang | Japanese Wordnet | Wordnet |
Jawa | Javanese Wordnet | Wordnet |
Melayu | Wordnet Bahasa | MIT |
Norwegia | Norwegian Wordnet | Wordnet |
Persia | Persian Wordnet | Free to Use |
Portugis | plWordnet | Wordnet |
Portugis | OpenWN-PT | CC-BY-SA-3.0 |
Spanyol | Multilingual Central Repository | CC-BY-3.0 |
Thailand | Thai Wordnet | Wordnet |
Referensi
Lihat juga
Pranala luar
Wikiwand - on
Seamless Wikipedia browsing. On steroids.