亚洲免费成人av电影_乱人伦xxxx国语对白_免费看一级毛片_综合av色偷偷网_欧美日韩免费做爰大片_97超级碰碰人国产在线观看_国产视频在线看_亚洲日韩中文字幕_中文字幕jux大岛优香

首頁 > 知識(shí)分享 > 知識(shí)分享 > LLM首次達(dá)到人類語言專家水平,OpenAI o1拿下拆解句法、識(shí)別歧義、推理音律

LLM首次達(dá)到人類語言專家水平,OpenAI o1拿下拆解句法、識(shí)別歧義、推理音律

發(fā)布時(shí)間:2025-11-08 18:08:45

LLM再下一城!伯克利研究證明:OpenAI的o1被證明也具有匹敵人類語言學(xué)家的元分析能力。

在人類諸多才能之中,哪些才是人類所獨(dú)有的?

自古希臘哲人亞里士多德以來,語言便被視為最能彰顯人之本性的標(biāo)志。他曾言:人類乃「具有語言的動(dòng)物」。

即使當(dāng)今的大語言模型如ChatGPT已能在表層上模擬人類的日常言談,學(xué)者們依然追問:

在人類語言的深處,是否蘊(yùn)藏著某些獨(dú)特的結(jié)構(gòu)與特質(zhì),是任何其他生物的溝通方式,乃至AI的運(yùn)算體系,皆無法真正企及的?

加州大學(xué)伯克利分校語言學(xué)家、羅格斯大學(xué)的攜手,讓多個(gè)大語言模型經(jīng)受一系列語言學(xué)測(cè)試——其中包括要求模型歸納虛構(gòu)語言的規(guī)則。

雖然大多數(shù)大語言模型未能像人類那樣解析語言學(xué)規(guī)則,但有一個(gè)模型展現(xiàn)出遠(yuǎn)超預(yù)期的驚人能力。它能像語言學(xué)研究生那樣分析語言——劃分句子成分、解析多重歧義,并能運(yùn)用遞歸等復(fù)雜語言學(xué)特征。

研究者Gašper Beguš表示,這一發(fā)現(xiàn)「挑戰(zhàn)了我們對(duì)人工智能能力的認(rèn)知」。

AI會(huì)說話不稀奇,會(huì)解釋才稀奇——

如果語言是讓我們成為人類的關(guān)鍵,那么如今大語言模型獲得了「元語言」能力,這又意味著什么呢?

LLM構(gòu)建無窮遞歸

想象一下:你在搭一座一層套一層、像俄羅斯套娃一樣的「句子塔」。

每套進(jìn)一層,理解難度就指數(shù)級(jí)上升。

這種結(jié)構(gòu),在語言學(xué)里叫「中心嵌入」(center embedding),曾被知名語言學(xué)家喬姆斯基稱為能定義人類語言與思維的決定性特征。

比如這句話:

The worldview that the prose Nietzsche wrote expressed was unprecedented.

(大意為:尼采所寫的那篇散文所表達(dá)的世界觀是前所未有的。)

表面上看平平無奇,但如果你拆開它的「語言洋蔥」:

最外層:The worldview [...] was unprecedented(這個(gè)「世界觀」前所未有);

套進(jìn)去一層:that the prose [...] expressed(是「那篇散文所表達(dá)的」);

再往里一層:Nietzsche wrote(而這篇散文是「尼采寫的」)。

這就像在一個(gè)句子中間,又塞進(jìn)一個(gè)完整的句子,再在那個(gè)句子里塞進(jìn)另一個(gè)句子——三層套娃,層層遞歸。

人類能理解這樣的句子,但之前,人們認(rèn)為這樣的能力大模型不具備。

上述句子在真實(shí)對(duì)話中幾乎從未出現(xiàn)過——因?yàn)榇蠹視?huì)覺得它「太繞了!」

所以,任何語言模型如果只是靠「背書」,根本不可能見過,自然也無法識(shí)別出這種例子。

語言學(xué)家們認(rèn)為,人類語言從有限詞匯和有限規(guī)則中生成無限可能句子,這種能力歸因于無限遞歸。

迄今為止,還沒有令人信服的證據(jù)表明其他動(dòng)物能夠以復(fù)雜的方式使用遞歸。

圖1:不同大模型識(shí)別多重遞歸,繪制正確語法樹的比例

圖1:不同大模型識(shí)別多重遞歸,繪制正確語法樹的比例

然而,該研究指出在眾多大模型中,唯有OpenAI o1模型不僅看懂包含多重遞歸的句子(圖1)。

o1不僅能如同語言學(xué)家那樣,以接近100%的正確率畫出正確的樹狀結(jié)構(gòu),還能將本就復(fù)雜的句子變得更多一層。

圖2:該句子對(duì)應(yīng)的正確語法樹

圖2:該句子對(duì)應(yīng)的正確語法樹

當(dāng)它被問:「能不能再加一層遞歸?」o1回復(fù):

The worldview that the prose that the philosopher Nietzsche admired wrote expressed was unprecedented.

「那位尼采所敬仰的哲學(xué)家所撰寫的散文所表達(dá)的世界觀是前所未有的。」

這說明o1不僅能夠使用語言,還能夠思考語言,具備元語言能力(metalinguistic capacity )。

由于語言模型只是在預(yù)測(cè)句子中的下一個(gè)單詞,人對(duì)語言的深層理解在質(zhì)上有所不同。因此,一些語言學(xué)家表示,大模型實(shí)際上并沒有在處理語言。

這項(xiàng)研究的結(jié)論看起來是對(duì)上述觀點(diǎn)的否定。

大模型能區(qū)分歧義

也能深入理解句子

想象一下,你聽到下面的話:「Eliza wanted her cast out.」

乍一聽,好像就是「Eliza想把她的cast趕出去」?

但「cast」這個(gè)詞既可以是動(dòng)詞(「驅(qū)逐」),也可以是名詞(「石膏」)!

于是這句話就有兩種不同的含義,分別是

Eliza想要她的石膏被拿出去,

Eliza想把她趕出去。

這樣識(shí)別包含多義性句子的能力,之前同樣被認(rèn)為大模型不具備。

人類擁有很多常識(shí)知識(shí),使我們能夠排除歧義。但大模型很難具有這樣的常識(shí)知識(shí)水平。

然而該研究表明,o1可正確識(shí)別兩種結(jié)構(gòu),并為每種生成了符合語言學(xué)規(guī)劃的句法樹。其他模型(如 GPT-4、Llama 3.1)只會(huì)生成不合語法的結(jié)構(gòu),還會(huì)對(duì)語義產(chǎn)生誤解。

該研究還考察了大模型在音韻學(xué)相關(guān)任務(wù)上的表現(xiàn)——

音韻學(xué)是研究聲音模式以及最小的聲音單位,即音素的組織方式。

例如,在英語中,給以「g」結(jié)尾的詞加上「s」會(huì)發(fā)出「z」的音,就像「dogs」一樣。但給以「t」結(jié)尾的詞加上「s」聽起來更像標(biāo)準(zhǔn)的「s」音,就像「cats」一樣。

該研究一口氣創(chuàng)建了30種新的迷你語言,以了解大模型是否能夠在面對(duì)新生成的虛擬語言時(shí),在沒有任何先驗(yàn)知識(shí)的情況下能不能正確推斷語音規(guī)則。

結(jié)果出人意料,即使是在這些虛構(gòu)的語言上,o1在音韻相關(guān)的任務(wù)上表現(xiàn)依舊出色。

大模型比人類更好地理解語言嗎?

從上述三個(gè)例子可以看出,曾經(jīng)那些被認(rèn)為僅僅人類能夠擁有的語言理解能力,大模型如今也具備了。

2023 年著名語言學(xué)家喬姆斯基在《紐約時(shí)報(bào)》上寫道:「語言的正確解釋很復(fù)雜,不能僅僅通過浸泡在大數(shù)據(jù)中就能學(xué)會(huì)。」

該文認(rèn)為盡管 AI 模型在運(yùn)用語言方面可能很擅長,但它們并不具備以復(fù)雜方式分析語言的能力。

在此思潮影響下,即使ChatGPT在各方面上復(fù)制了自然語言,公眾仍想知道大模型是否有人類語言的特定特征能不能由大模型復(fù)現(xiàn)。

這當(dāng)然很有必要,隨著社會(huì)越來越依賴大模型,了解它在哪些方面能成功以及哪些方面會(huì)失敗變得越來越重要。

語言分析是評(píng)估語言模型推理能力與人類相似程度的理想測(cè)試平臺(tái)。

而o1能夠以與語言學(xué)家相似的方式分析語言,例如繪制句子圖、解決多個(gè)歧義含義,并利用遞歸等復(fù)雜的語言特征

但我們發(fā)現(xiàn)這一現(xiàn)象后,人們不禁會(huì)問下面兩個(gè)問題:

第一個(gè)問題是為何只有o1可行,其它大模型表現(xiàn)都差一大截。

回答是相比其它模型,o1 的優(yōu)勢(shì)很可能源于思維鏈(類似Deepseek的深度思考),使其能像人類語言學(xué)家一樣逐步推理、驗(yàn)證假設(shè)、構(gòu)建抽象規(guī)則。

第二個(gè)問題是當(dāng)模型的性能隨著規(guī)模變大而變大時(shí),大模型是否有一天會(huì)比我們更能準(zhǔn)確的理解語言嗎?

對(duì)于這個(gè)問題的回答,目前還沒有定論。

一方面,任何的大模型在語言學(xué)上還沒有提出過原創(chuàng)性的觀點(diǎn),也沒有教給我們關(guān)于語言的新知識(shí)。

另一方面,增加計(jì)算能力和訓(xùn)練數(shù)據(jù),語言模型最終會(huì)在語言技能上超越我們,   看不出有什么理由阻止語言模型展現(xiàn)出比我們更好的語言理解能力。

研究尚不足以宣稱「機(jī)器理解語言勝于人類」,但足以改變?cè)u(píng)價(jià)口徑:對(duì)模型的考察,應(yīng)從「任務(wù)產(chǎn)出」轉(zhuǎn)向「結(jié)構(gòu)解釋」。

當(dāng)可解釋性成為首要指標(biāo),AI研究、教育與應(yīng)用治理將迎來同一套標(biāo)準(zhǔn)——把「為什么對(duì)」放在「對(duì)不對(duì)」之前。

知識(shí)分享更多>>

鴻蒙智行2025壓軸車,新款享界S9 24小時(shí)小訂破5000臺(tái) LLM首次達(dá)到人類語言專家水平,OpenAI o1拿下拆解句法、識(shí)別歧義、推理音律 硅谷華人女CEO殺入,全球首家AI影工廠引爆“AI韓流” TikTok Shop第3季度全球狂攬約190億美元,短視頻帶貨大獲成功 消息稱高通驍龍8 Gen5芯片暫定11月底發(fā)布 隔著屏幕真能聞到味兒了,“氣味電視”亮相 有幾百種味道 網(wǎng)友質(zhì)疑淘寶“雙11霸屏廣告” 杭州市監(jiān):已收到舉報(bào)展開調(diào)查 DRAM漲價(jià)潮來襲,英偉達(dá)熱銷顯卡RTX 5060 Ti被曝供應(yīng)告急 馬斯克:特斯拉將在一兩個(gè)月內(nèi)開放“邊開車邊發(fā)短信”功能 消息稱榮耀第二塊萬級(jí)大電池試產(chǎn),典型值9900mAh± 東方甄選孫東旭也走了!俞敏洪為什么學(xué)不了任正非? 豆包兇猛,深度解析字節(jié)AI戰(zhàn)略 eSIM手機(jī)成新趨勢(shì),華為、vivo們的路徑分野 TikTok東南亞用戶超過4.6億,電商、商業(yè)化均數(shù)據(jù)亮眼 劉強(qiáng)東請(qǐng)京東騎手吃肯德基 犒勞京東雙11開門紅送單 REDMI K90全系沒有2K屏,對(duì)比上代退步了?官方回應(yīng) 英偉達(dá)為何值5萬億美元?答案或藏在AI數(shù)據(jù)中心里 何小鵬:今年科技日關(guān)鍵詞為“涌現(xiàn)” 小鵬在物理AI領(lǐng)域涌現(xiàn)出驚喜的能力 豪投AI取得回報(bào) 孫正義財(cái)富暴漲248%超柳井正成日本首富 投OpenAI損失31億美元利潤 微軟第一財(cái)季凈利潤同比增長12% 谷歌母公司第三季度營收首破1000億美元 凈利潤同比增長33% Meta第三季度凈利潤因特朗法案大降83% 股價(jià)大跌8% 要解決老頭樂行業(yè)野蠻生長的“后遺癥”,需要通過標(biāo)準(zhǔn)的建立、監(jiān)管的加強(qiáng)和行業(yè)的自律 理想汽車:不僅完成了L系列和理想MEGA煥新,還推出了兩款純電SUV車型,加速著開辟純電這一第二增長曲線的腳步 豐田汽車公司表示,8月份其全球銷量達(dá)到900,598輛(包括子公司大發(fā)汽車和日野汽車) 新能源汽車產(chǎn)業(yè)終究成了中國汽車從邊緣走向舞臺(tái)中央的最大推手 F5詳解:AI大數(shù)據(jù)時(shí)代,如何保障車輛通信可靠性和低延遲? 特斯拉Model Y L再推配置升級(jí),全新淺灰色高級(jí)內(nèi)飾正式上線,選裝價(jià)8000元 SpaceX正悄然組建一支志愿者消防隊(duì),以服務(wù)其龐大的星際基地發(fā)射與制造綜合體 比亞迪10月智能化OTA推送:5大新增功能 主流音樂軟件全覆蓋
国产精品99久久久精品无码| theav精尽人亡av| 国产精品老牛影院在线观看| 欧美精品一区二区久久久| 亚洲综合色噜噜狠狠| 久久久久久久免费视频了| 久久久一二三| 婷婷丁香综合| 国产精品欧美在线观看| 精品三级久久久| 国产高清不卡| 国产乱码午夜在线视频| 精品视频一二区| 在线观看av影片| 免费一级网站| 成人免费在线观看网站| 91激情视频| 国产视频二区三区| 欧美白人最猛性xxxxx| 亚洲免费成人在线| 91九色蝌蚪91por成人| 国产精品久久久久久久久久久久久久久久久| 五月天综合视频| 精品无码人妻一区| 久久福利小视频| 手机免费看av片| 国产情侣久久久久aⅴ免费| 亚洲小视频网站| 日韩一区二区三区不卡视频| 国产熟女高潮视频| 激情网站五月天| 国产精品久久久久9999小说| 日韩欧美在线播放视频| 乱子伦视频在线看| 日本免费色视频| 色诱av手机版| 免费黄色在线视频| 久久综合色之久久综合| 天天操天天操天天操天天| 玉米视频成人免费看| 国产精品一级二级三级| 麻豆精品一区二区综合av| 日韩精品91亚洲二区在线观看| 国产欧美日韩综合一区在线播放| 国产欧美亚洲一区| 视频一区二区不卡| 韩国精品一区二区| 国产91丝袜在线18| 成人h精品动漫一区二区三区| 成人免费福利片| 欧美激情综合五月色丁香小说| 国产欧美精品一区| 一区二区三区在线不卡| 色一区在线观看| 欧美精品黑人性xxxx| 精品福利在线导航| 中文字幕视频在线免费欧美日韩综合在线看 | 免费人成黄页网站在线一区二区 | 成人av手机在线观看| 26uuu久久天堂性欧美| 亚洲婷婷在线视频| 色综合久久综合网97色综合| 国产极品美女高潮无套嗷嗷叫酒店 | 丰满少妇xoxoxo视频| 日日夜夜精品免费| 日本亲与子乱a| 亚洲裸体视频| 捆绑变态av一区二区三区| 亚洲爆乳无码一区二区三区| 日韩一级片免费在线观看| 久久久免费网站| free性欧美高清另类| 人日人天天爽| 日本成人一区二区三区| 成人影院在线看| 玖玖精品在线| 精品日本12videosex| 亚洲欧美视频| 91一区一区三区| 精品久久久久久久久久久| 日韩一区二区三区视频| 久久精品久久久久久国产 免费| 热久久免费视频精品| 亚洲ww精品| 1313精品午夜理伦电影| 亚洲第一伊人| 久久人人超碰精品| 欧洲精品一区二区三区在线观看| 日韩成人在线视频观看| 国产成人精品免费视频| 性欧美.com| 国产成人精品一区二区在线小狼 | 激情成人综合网| 亚洲乱码精品一二三四区日韩在线| 91精品国产综合久久精品图片| 欧美成人激情视频免费观看| 国产综合色一区二区三区| 日日摸天天爽天天爽视频| 最新日韩免费视频| 男人天堂av网| 中文在线一二区| 日韩一级特黄| 国产毛片久久| 亚洲线精品一区二区三区| 在线电影av不卡网址| 国产视频精品网| 色综合久久久无码中文字幕波多| 国产一区二区99| 女生裸体无遮挡天堂网站免费| 自拍视频在线网| 成人一二三区| 久久蜜臀精品av| 日韩精品在线免费播放| 成人资源av| 无码人妻精品一区二区三| 国产三级小视频| 中文视频在线| 欧美sss在线视频| av在线播放成人| 国产视频自拍一区| 日本亚洲欧洲精品| 欧美午夜aaaaaa免费视频| 波多野结衣理论片| 久久mv成人精品亚洲动漫| 欧洲大片精品免费永久看nba| 久久国产精品99久久久久久老狼| 欧美喷潮久久久xxxxx| 亚洲伊人久久综合| 亚洲午夜久久久| 在线观看久久久久久| 视频一区二区综合| 中文字幕电影av| 猛性xxxxx| 二区三区精品| 99精品视频在线观看| 亚洲视频视频在线| 91免费视频黄| 精品国产乱子伦| 视频三区在线观看| 国产精品成久久久久| 欧美日韩中文字幕日韩欧美| 国产精品亚洲片夜色在线| 无码人妻精品一区二区三| 思思99精品视频在线观看| 成人欧美大片| 成人性生交大合| 久久天天躁夜夜躁狠狠躁2022| 久久av综合网| 无码人妻熟妇av又粗又大| 牛牛澡牛牛爽一区二区| 午夜视频一区| 3atv一区二区三区| 亚洲国产日韩美| 成年人av网站| 香蕉视频免费在线播放| 久热综合在线亚洲精品| 亚洲欧美国内爽妇网| 尤物av无码色av无码| 国产av无码专区亚洲av麻豆| 中文字幕中文字幕在线中高清免费版 | 中文字幕亚洲一区| 黑森林福利视频导航| 国产亚洲精品熟女国产成人| 免费毛片一区二区三区| 女生裸体视频网站免费观看| 天天躁日日躁狠狠躁欧美巨大小说| 日本一二三四高清不卡| 欧洲一区二区视频| 欧产日产国产精品98| 免费吸乳羞羞网站视频| 黑丝美女一区二区| 欧美性极品少妇| 在线国产伦理一区| jizz中国女人| 香蕉成人影院| 国产精品的网站| 成人免费看片网址| 国产精品视频久久久久久久| 香蕉视频网站在线观看| 国产伦精品一区二区三区视频青涩| 久久精品久久精品亚洲人| 无码人妻一区二区三区一| 九色蝌蚪自拍| 亚欧美无遮挡hd高清在线视频| 日韩欧美aaaaaa| 欧美 国产 综合| 亚洲一级黄色大片| 爱啪啪综合导航| 视频一区在线播放| 日韩亚洲第一页| 中国特级黄色大片| 日本h视频在线观看| heyzo久久| 日韩精品资源二区在线| 免费看av软件| 亚洲精品一区中文字幕电影| 亚洲一区二区91| 久草成人在线视频| 亚洲sss视频| 一本色道久久综合亚洲精品不卡|