Google 是一家極度看重演算法、充滿工程師文化的公司,但或許你還是會為此而感到驚奇——他們認為翻譯是一個數學和統計學方面的問題。最近,位於 Google 總部的 Google Translate 團隊正迅速擴張,他們新招募了數名德國電腦科學家,但卻沒有任何一名語言學家。
我相信你已經能知道 Google 是一家極度看重演算法、充滿工程師文化的公司,但或許你還是會為此而感到驚奇——他們認為翻譯是一個數學和統計學方面的問題。最近,位於 Google 總部的 Google Translate 團隊正迅速擴張,他們新招募了數名德國電腦科學家,但卻沒有任何一名語言學家。
Google Translate 部門主管 Franz Josef Och 同樣也是德國電腦科學家出身,他不但並不精通語言學,甚至並不擅長語言學習。他認為,機器翻譯的關鍵在對數學、統計和程式設計方面的擅長。
Google Translate 團隊並不會去模仿人工翻譯的方式,這就是他們沒有去開發字典、定義語法結構和規則的原因。事實上,語法規則對目前的電腦來說仍然難以掌控。Google 更著重於以大數據和統計的方式入手,翻譯系統會不斷地調整翻譯結果的相關性並自我學習如何處理數十億的文字。通過這種方式,電腦最終能不斷優化翻譯結果。
以大數據方式做翻譯的一個好處是,翻譯系統會隨著資料的積累而不斷地改善。Google Translate 目前已經支援 71 種語言的互譯,去年用戶的使用次數已經達到 2 億次。此外,索引全球網頁的 Google 還能夠依靠網際網路上已經存在的翻譯內容改善自己的翻譯系統。
This entry passed through the Full-Text RSS service — if this is your content and you're reading it on someone else's site, please read the FAQ at fivefilters.org/content-only/faq.php#publishers. Five Filters recommends: