日韩中文字幕在线一区二区三区,亚洲热视频在线观看,久久精品午夜一区二区福利,精品一区二区三区在线观看l,麻花传媒剧电影,亚洲香蕉伊综合在人在线,免费av一区二区三区在线,亚洲成在线人视频观看
          首頁(yè) 500強(qiáng) 活動(dòng) 榜單 商業(yè) 科技 商潮 專題 品牌中心
          雜志訂閱

          機(jī)器能否真正習(xí)得語(yǔ)言?

          章勱聞
          2024-03-15

          之前的機(jī)器學(xué)習(xí)更像二語(yǔ)習(xí)得,而今天的生成式人工智能則接近母語(yǔ)學(xué)習(xí)。

          文本設(shè)置
          小號(hào)
          默認(rèn)
          大號(hào)
          Plus(0條)

          過(guò)去一年注定會(huì)成為人類歷史的重要章節(jié)——在經(jīng)歷了信息爆炸和信息過(guò)剩之后,“語(yǔ)言失控的時(shí)代”到來(lái)了。準(zhǔn)確地說(shuō)是人類失去了對(duì)語(yǔ)言的控制。去年初GPT新版本發(fā)布時(shí),簡(jiǎn)短的介紹最后有一句憂心忡忡的話:“人類已經(jīng)難以分辨出大模型撰寫的新聞。”到年底,生成式人工智能(AIGC)產(chǎn)生的語(yǔ)言文字已經(jīng)遠(yuǎn)遠(yuǎn)超越新聞內(nèi)容,變得無(wú)處不在、難以統(tǒng)計(jì)。

          要說(shuō)明一點(diǎn):失控并非一定導(dǎo)致災(zāi)難,更重要的是看能否適應(yīng)這種變化。就像人類未曾能夠控制微小尺度間病毒的來(lái)去,也從來(lái)無(wú)法阻止宇宙尺度上天體的運(yùn)行,我們只是適應(yīng)了這些規(guī)律。同樣,生成式人工智能雖然還在誕生的早期,但是它讓我們窺見(jiàn)一種可能:人類也許從來(lái)不是語(yǔ)言唯一的主人,而只是臨時(shí)看護(hù)了它的成長(zhǎng)。要理解這一點(diǎn),首先要思考一個(gè)問(wèn)題:機(jī)器能否真正習(xí)得語(yǔ)言?

          回到18年前的冬天,在牛津北郊的學(xué)生宿舍里,我在一臺(tái)二手的ThinkPad上處理著導(dǎo)師購(gòu)買的33萬(wàn)篇《紐約時(shí)報(bào)》語(yǔ)料,試圖通過(guò)機(jī)器學(xué)習(xí)讓算法能夠生成新聞背景。那一年,俄羅斯的“庫(kù)爾斯克號(hào)”核潛艇發(fā)生事故,沉入了海底。我立刻做了實(shí)驗(yàn),發(fā)現(xiàn)算法對(duì)潛艇災(zāi)難的歸納與媒體報(bào)道高度相似。

          我的導(dǎo)師是后來(lái)DeepMind的研究成員之一,他提醒我:實(shí)驗(yàn)的成功可能緣于新聞文體的特殊性,而并非算法。這也加深了我的疑惑:我們似乎總是在存量信息中尋找規(guī)律,比如“新聞第一段總是存在各種事實(shí)要素”等。這似乎是在靠經(jīng)驗(yàn)和概率提升運(yùn)氣,而并非真正讓機(jī)器學(xué)會(huì)語(yǔ)言。

          這其中涉及到的專業(yè)叫“自然語(yǔ)言處理”。當(dāng)時(shí)在同一間公寓里,另一位學(xué)者在研究“二語(yǔ)習(xí)得”,也就是人類如何學(xué)習(xí)母語(yǔ)之外的第二外語(yǔ)。我們交談之后,感覺(jué)兩門學(xué)科有相似之處,也存在類似的問(wèn)題。

          最近,在和獵豹移動(dòng)董事長(zhǎng)兼首席執(zhí)行官傅盛的對(duì)話中,他忽然讓我理解了這種聯(lián)系。傅盛的觀點(diǎn):之前的機(jī)器學(xué)習(xí)更像二語(yǔ)習(xí)得,而今天的生成式人工智能則接近母語(yǔ)學(xué)習(xí)。簡(jiǎn)單理解:人類學(xué)習(xí)第二外語(yǔ)學(xué)習(xí)必須“錨定”一種母語(yǔ),是一種關(guān)聯(lián)經(jīng)驗(yàn)的過(guò)程。作為對(duì)比,母語(yǔ)的習(xí)得則是人腦“沉浸”于客觀世界后獲得的整體印象,其過(guò)程更為“神秘且偉大”。

          生成式人工智能的顛覆性在于:硅基智能一次性地完成了沉浸式的母語(yǔ)習(xí)得,而且接受了人類現(xiàn)存的上百種語(yǔ)言,以及語(yǔ)言所承載的人類知識(shí)和信息的總和。這種過(guò)程究竟創(chuàng)造了一個(gè)什么樣的事物,我們還在試圖理解,但是可以肯定其能量遠(yuǎn)超我們的想象。

          舉個(gè)例子,最近讀到一段質(zhì)量不高的文字,講述了亞馬遜創(chuàng)始人杰夫·貝佐斯和一位Kindle早期設(shè)計(jì)師之間的恩恩怨怨。英文存在大量模糊的語(yǔ)言和跳躍的邏輯。我嘗試用一個(gè)國(guó)產(chǎn)大模型來(lái)翻譯這段話。結(jié)果發(fā)現(xiàn)AI不僅完成了英譯中,還補(bǔ)上了一些原文缺失的背景和邏輯關(guān)系,比如這位設(shè)計(jì)師離職后的故事。這種跨語(yǔ)言文化、深入到事件背景的梳理恰恰就是以前人類編輯的工作。現(xiàn)在,機(jī)器不僅完成了文字創(chuàng)作,而且在速度和質(zhì)量上遠(yuǎn)超人類。

          這個(gè)大模型是中國(guó)90后的人工智能天才楊植麟開(kāi)發(fā)的“月之暗面”。很顯然,暫且忽略機(jī)器是否有“意識(shí)”和“情感”這些問(wèn)題,人工智能至少已經(jīng)從錨定人類的認(rèn)知框架,跨越到了“母語(yǔ)學(xué)習(xí)”,直接認(rèn)識(shí)了客觀世界。試想一下,未來(lái)它們將會(huì)取代多少人類的腦力勞動(dòng)?

          發(fā)刊前,我做了一個(gè)實(shí)驗(yàn),讓“月之暗面”閱讀了兩篇中英文的年度盤點(diǎn),請(qǐng)它摘引一句對(duì)人類最有啟示的話。它選擇了拼多多創(chuàng)始人黃錚的一句意味深長(zhǎng)的直接引語(yǔ):“簡(jiǎn)單和常識(shí)的力量是無(wú)窮的。”(財(cái)富中文網(wǎng))

          原文刊載于1/2月刊《財(cái)富》(中文版)雜志。

          財(cái)富中文網(wǎng)所刊載內(nèi)容之知識(shí)產(chǎn)權(quán)為財(cái)富媒體知識(shí)產(chǎn)權(quán)有限公司及/或相關(guān)權(quán)利人專屬所有或持有。未經(jīng)許可,禁止進(jìn)行轉(zhuǎn)載、摘編、復(fù)制及建立鏡像等任何使用。
          0條Plus
          精彩評(píng)論
          評(píng)論

          撰寫或查看更多評(píng)論

          請(qǐng)打開(kāi)財(cái)富Plus APP

          前往打開(kāi)