如果讓剛開(kāi)始學(xué)一門(mén)新外語(yǔ)的你去參與網(wǎng)頁(yè)內(nèi)容翻譯,是不是有些意外?可Duolingo就能讓這事發(fā)生。這個(gè)將眾包翻譯和外語(yǔ)學(xué)習(xí)交融在一起的網(wǎng)站在正式上線的三個(gè)月后獲得了由NEA領(lǐng)投的1500萬(wàn)美元B輪融資,其A輪投資者Union Square Ventures也參投。
DuoLingo的模式可謂是”一箭雙雕”,讓人們免費(fèi)學(xué)習(xí)外語(yǔ)的同時(shí)也利用眾包完成其他網(wǎng)頁(yè)內(nèi)容的翻譯,或者說(shuō)是以外語(yǔ)學(xué)習(xí)為激勵(lì)讓人們免費(fèi)做網(wǎng)頁(yè)翻譯的工作。DuoLingo從聽(tīng)說(shuō)讀譯方方面面來(lái)幫你打開(kāi)通向新語(yǔ)言的大門(mén)。學(xué)習(xí)新單詞時(shí)DuoLingo會(huì)配以圖片和讀音幫你加深記憶,且用聽(tīng)寫(xiě)單詞、看圖猜詞、檢測(cè)你發(fā)音等多樣化的方式讓你在練習(xí)中鞏固所學(xué)的語(yǔ)言知識(shí)。 在你學(xué)完一定量的單詞和語(yǔ)法知識(shí)后,DuoLingo會(huì)在練習(xí)中讓你翻譯句子。這些句子都是取自實(shí)際的網(wǎng)頁(yè)內(nèi)容,而不是現(xiàn)成的外語(yǔ)教材,你不用去學(xué)那些普通教材編寫(xiě)者所杜撰出來(lái)的”常用對(duì)話”了。 這些待翻譯的句子并不是隨機(jī)分配給外語(yǔ)學(xué)習(xí)者,而是針對(duì)不同用戶的學(xué)習(xí)程度來(lái)給出適宜難度的句子。比如所給的句子中可能就涵蓋你剛才學(xué)完的新詞和語(yǔ)法結(jié)構(gòu),若你還沒(méi)完成現(xiàn)在進(jìn)行時(shí)的時(shí)態(tài)學(xué)習(xí),DuoLingo就不太會(huì)分配給你這個(gè)時(shí)態(tài)的句子。DuoLingo也自有一套保障翻譯準(zhǔn)度的機(jī)制,而不會(huì)直接采納某位用戶的翻譯。它會(huì)比對(duì)各個(gè)用戶對(duì)同一個(gè)句子的翻譯相似度,如果相似度都很高則可以確定下正確的答案。除此之外,用戶也對(duì)其他人的翻譯進(jìn)行投票,這樣DuoLingo就能綜合考量出最恰當(dāng)?shù)姆g。 游戲化和社交化也被融入DuoLingo中。學(xué)習(xí)過(guò)程中你會(huì)有持續(xù)的積分刺激,你也可關(guān)注你的好友互相監(jiān)督學(xué)習(xí)進(jìn)度并結(jié)識(shí)與正和你學(xué)習(xí)相同語(yǔ)言的朋友,DuoLingo還開(kāi)辟了問(wèn)答社區(qū),供學(xué)習(xí)者發(fā)問(wèn)并討論。
DuoLingo承諾會(huì)(對(duì)學(xué)習(xí)者)永久免費(fèi),且網(wǎng)站也不會(huì)放置廣告。而盈利方式則是向翻譯需求方收費(fèi)。機(jī)器翻譯往往較干澀,而DuoLingo的人工翻譯顯然會(huì)更有”人情味”?,F(xiàn)在通過(guò)DuoLingo上傳待翻譯的文件并獲得譯稿是免費(fèi)的,但后續(xù)DuoLingo會(huì)針對(duì)翻譯速度和準(zhǔn)度收取一定費(fèi)用。網(wǎng)站現(xiàn)有周活躍用戶25萬(wàn),人均每天停留半個(gè)小時(shí)。DuoLingo不久也會(huì)推出移動(dòng)客戶端。 Luis von Ahn是DuoLingo的創(chuàng)始人,他成長(zhǎng)于危地馬拉(拉丁美洲國(guó)家,官方語(yǔ)言是西班牙語(yǔ))。他發(fā)現(xiàn)對(duì)于不會(huì)英語(yǔ)的當(dāng)?shù)赜H戚而言,可供閱讀的網(wǎng)頁(yè)很少。即便是在互聯(lián)網(wǎng)中,這種由于語(yǔ)言而產(chǎn)生的信息隔閡仍很明顯,而打破這種隔閡就要翻譯網(wǎng)頁(yè)內(nèi)容。那何不利用眾包來(lái)翻譯整個(gè)網(wǎng)絡(luò)?怎么才能讓成千上萬(wàn)人來(lái)免費(fèi)做這件事呢?正如上文所說(shuō),DuoLingo就在外語(yǔ)學(xué)習(xí)和翻譯眾包這兩者中搭建出了雙贏模式。 你可能并不熟悉Luis von Ahn這個(gè)名字,但你一定熟悉每天都在輸入的網(wǎng)站驗(yàn)證碼。驗(yàn)證碼(CAPTCHA)就是2000年Luis von Ahn(當(dāng)時(shí)他是CMU博士生)和其他幾位學(xué)者共同研究出的用于鑒別在屏幕前的你到底是人類還是機(jī)器的方法。而到了2007年,von Ahn先生也為人們每天在輸入驗(yàn)證碼上浪費(fèi)過(guò)多時(shí)間而”感到愧疚”,于是reCAPTCHA誕生了。(后來(lái)reCAPTCHA被google收購(gòu),用以圖書(shū)數(shù)字化和街景中路牌識(shí)別。) reCAPTCHA讓你在輸入驗(yàn)證碼的同時(shí)也為紙質(zhì)書(shū)籍的電子化做了貢獻(xiàn),它會(huì)給用戶呈現(xiàn)出兩個(gè)單詞,其中一個(gè)單詞是計(jì)算機(jī)已知道的(這個(gè)單詞就用于確認(rèn)你不是機(jī)器),而另外一個(gè)單詞是從掃描的書(shū)籍中摘取下來(lái)計(jì)算機(jī)識(shí)別不清的。如果你輸對(duì)了那個(gè)驗(yàn)證碼單詞,計(jì)算機(jī)會(huì)記錄下你識(shí)別出的那個(gè)模糊單詞。再比對(duì)幾個(gè)人對(duì)同一個(gè)單詞的識(shí)別,最后就能確定書(shū)籍中的那個(gè)模糊單詞究竟是什么了。 DuoLingo和reCAPTCHA一樣,都是利用眾包式的人機(jī)合作(Human Computation)模式來(lái)解決單憑借計(jì)算機(jī)或人力都難以完成的事情。計(jì)算機(jī)的規(guī)模處理能力很強(qiáng)大,但仍有許多需要人類智慧的地方它不太擅長(zhǎng)。雖然人類沒(méi)有計(jì)算機(jī)這么強(qiáng)大的處理能力,但如果合理分解任務(wù),再委派給大眾,則效果會(huì)好到出人意料(想想維基百科)??稍囉靡幌翫uoLingo,以新的方式學(xué)語(yǔ)言并為消除網(wǎng)頁(yè)內(nèi)容隔閡做點(diǎn)小貢獻(xiàn)。
另:Luis von Ahn在這個(gè)TED演講(可選中文字幕)中講述了reCAPTCHA和DuoLingo的由來(lái),并介紹大規(guī)模在線合作模式,推薦觀看。