百度擊敗微軟與Google AI自然語(yǔ)言理解摘冠
- 來(lái)源:互聯(lián)網(wǎng)
- |
- 2020-01-09
- |
- 0 條評(píng)論
- |
- |
- T小字 T大字
推薦語(yǔ):百度在人工智能方面確實(shí)取得了巨大的進(jìn)步,這體現(xiàn)在它的語(yǔ)音識(shí)別率更高、更準(zhǔn)確,而在自動(dòng)駕駛方面也居于行業(yè)領(lǐng)先地位,這次它能成功擊敗谷歌和微軟就證明了它在人工智能方面所擁有的技術(shù)優(yōu)勢(shì)。
作者:DIGITIMES陳宜君
![](http://pics7.baidu.com/feed/86d6277f9e2f070886d95531c9d5b89fa801f21e.png?token=ebde15c06b212067479f7cad85fb847f&s=06D1CA7C02B2E1CE448A1B810300C08C)
憑借中、英文之間的語(yǔ)言差異,國(guó)內(nèi)搜尋引擎巨擘百度在一項(xiàng)人工智能(AI)自然語(yǔ)言處理競(jìng)賽中,擊敗微軟(Microsoft)和全球搜尋引擎龍頭Google,奪得冠軍。
在自然語(yǔ)言理解的通用語(yǔ)言理解評(píng)估(General Language Understanding Evaluation;GLUE)基準(zhǔn)與分析平臺(tái)上,百度的ERNIE模型獲得最高的90.1分,超越微軟的89.9分和Google的89.7分。
ERNIE模型最初是為理解中文語(yǔ)言而開(kāi)發(fā),不過(guò)百度研究人員很快就發(fā)現(xiàn)此模型也能更正確理解英語(yǔ)。
ERNIE是受Google用來(lái)訓(xùn)練AI理解人類語(yǔ)言的BERT模型啟發(fā)而來(lái)。BERT是一種屏蔽式語(yǔ)言模型,會(huì)在給定的每份文本中遮隱15%的單詞,然后嘗試根據(jù)上下文進(jìn)行預(yù)測(cè)。
不過(guò)許多漢字唯有與其他漢字組合在一起時(shí),才會(huì)有明確的內(nèi)在含意,這是中、英文的一項(xiàng)重要語(yǔ)言差異。百度團(tuán)隊(duì)必須訓(xùn)練其AI模型理解如何先隱藏一串有意義的漢字,再預(yù)測(cè)這些被遮隱的內(nèi)容。
百度團(tuán)隊(duì)在其原始碼代管平臺(tái)Github頁(yè)面上說(shuō)明ERNIE所采用的技術(shù)時(shí),以哈利波特(Harry Potter)是英國(guó)小說(shuō)家羅琳(J. K. Rowling)所寫(xiě)的系列奇幻小說(shuō),作為說(shuō)明范例。
該說(shuō)明指出,BERT模型能透過(guò)文本中同時(shí)出現(xiàn)的J、K和Rowling等單詞,確定K在這份文本中所代表的意思,卻無(wú)法學(xué)習(xí)和J. K. Rowling有關(guān)的任何知識(shí);ERNIE則能透過(guò)分析單詞和實(shí)體所隱藏的知識(shí),推論Harry Potter和J. K. Rowling之間的關(guān)系,進(jìn)而推論Harry Potter是J. K. Rowling所寫(xiě)的小說(shuō)。
隨著百度算法開(kāi)始能理解有意義的單詞,不再只是識(shí)別單一漢字后,ERNIE模型在中、英文理解上都有更好的表現(xiàn)。此后百度就將ERNIE應(yīng)用于實(shí)際生活中,利用此AI模型提供更好的搜尋結(jié)果。人工智能促進(jìn)協(xié)會(huì)(Association for the Advancement of Artificial Intelligence)曾在2019年2月的年會(huì)中,接受一篇以ERNIE模型為主題的報(bào)告在會(huì)上發(fā)表。
自Google在2010年退出國(guó)內(nèi)后,國(guó)內(nèi)搜尋引擎市場(chǎng)一直由百度獨(dú)霸,囊括70%的市占率。不過(guò)網(wǎng)際網(wǎng)絡(luò)使用模式的改變,讓百度的優(yōu)勢(shì)開(kāi)始松動(dòng)。包括騰訊微信在內(nèi)的自成一體超級(jí)應(yīng)用程序(App)生態(tài)體系在中國(guó)崛起,意味民眾觀賞影片、閱讀新聞、在在線購(gòu)物或下單美食外送時(shí),都不必再仰賴傳統(tǒng)搜尋引擎。
此外,因短片App抖音風(fēng)靡全球而崛起的字節(jié)跳動(dòng)公司在2019年推出頭條搜索,在國(guó)內(nèi)搜尋引擎市場(chǎng)掀起新一波競(jìng)爭(zhēng)。字節(jié)跳動(dòng)聲稱,正在打造一個(gè)通用搜尋引擎,以提供更理想的用戶體驗(yàn)。
- 標(biāo)簽:
- 編輯:李娜
- 相關(guān)文章