看點:圖靈測試過時了!奧特曼與量子計算之父提出的2.0來了
新智元報道
(相關(guān)資料圖)
編輯:艾倫
【新智元導(dǎo)讀】隨著現(xiàn)在的主流大模型都能輕松通過圖靈測試,這個持續(xù)了數(shù)十年的標(biāo)準(zhǔn)開始逐漸過時。奧特曼和量子計算之父David Deutsch討論得出了一個新的圖靈測試2.0標(biāo)準(zhǔn),可以更好地衡量究竟怎樣AI才算擁有真正的智能。
在過去的一年里,如果你還在用圖靈測試來評判一款大模型是否聰明,那可能已經(jīng)有點跟不上節(jié)奏了。
從GPT-4、Claude 2、Gemini、LLaMA 3開始的這些模型,已經(jīng)可以輕輕松松在圖靈測試中拿到通行證。
有研究者甚至表示:圖靈測試已經(jīng)過時了。
只要模型在網(wǎng)上混得久一點、見多識廣一點,就能騙過絕大多數(shù)人類評審。
問題是:一臺會說話的機器,真的代表它理解你說的話嗎?
在最近的Axel Springer頒獎典禮上,奧特曼和量子物理學(xué)家David Deutsch正面交鋒,提出了一個新標(biāo)準(zhǔn)。
他們的對話中,一個大膽的提議浮出水面——圖靈測試2.0。
圖靈測試
1950年,圖靈在那篇著名論文《計算機器與智能》(Computing Machinery and Intelligence)中設(shè)想:如果一臺機器能通過文字交流騙過人類評審,讓人以為它是另一個人,那么它就具備了智能。
這個標(biāo)準(zhǔn)在七十年前或許非常超前,但在今天的模型面前,已經(jīng)有些不堪一擊。
2023年底,UCSD的一項研究找來500名受訪者與大模型對話,結(jié)果發(fā)現(xiàn)GPT-4在偽裝成人類時勝率超過50%,而人類本身在這個測試中的識別率也不過如此。
Claude 2、LLaMA 3也都在類似實驗中表現(xiàn)出色,順利蒙混過關(guān)。
也就是說,按照圖靈的標(biāo)準(zhǔn),它們已經(jīng)可以被認為是「有智能」的了。但這真的夠了嗎?
圖靈測試2.0:
解出量子引力,再講給我們聽
在Axel Springer的頒獎典禮上,主持人提到奧特曼最喜歡的一本書是《無窮的開始:世界進步的本源》,于是主辦方搞了個「驚喜連線」——作者David Deutsch出現(xiàn)在大屏幕上。
于是,一場關(guān)于AI是否真的「懂得思考」的對談開始了。
Deutsch的核心觀點是:真正的智能,應(yīng)該能夠創(chuàng)造新知識、提出新假設(shè)、解決新問題,甚至推翻舊認知。
奧特曼接話拋出了一個假設(shè):
如果某個模型哪天解出了量子引力的問題,并且能清楚地告訴我們它是怎么想的、為啥這么選,那這是不是就能算是真正的智能?
Deutsch回答:是的。
奧特曼點頭:「那我也同意用這個標(biāo)準(zhǔn)。」
一拍即合。奧特曼和Deutsch版圖靈測試2.0誕生了。
David Deutsch簡介
David Deutsch是個很特別的人。
他是量子計算理論的早期提出者之一,1985年就發(fā)表了關(guān)于「量子圖靈機」的論文(Quantum theory, the Church-Turing principle and the universal quantum computer),為之后的量子計算模型打下基礎(chǔ)。
但他更出圈的身份,是一位科學(xué)哲學(xué)布道者。
在《無窮的開始:世界進步的本源》里,他提出一個觀點:人類文明的進步,來自于不斷創(chuàng)造好解釋(good explanations)。
而「好解釋」的產(chǎn)生,正是智能的核心。
所以他在那場對談中,不斷強調(diào)「解釋力」——不僅要得到答案,還要能說清楚它為什么成立。否則只能算是黑箱,不算是真正的理解。
為什么我們需要圖靈測試2.0
從一開始,圖靈測試就是個偽裝游戲??简灥牟皇茿I是否聰明,而是它能不能騙過人類。
但今天的模型越來越會騙了,有時連自己是不是AI都不太確定。
這讓圖靈測試在某種程度上失去了它的參考價值。
而Deutsch和Altman所設(shè)想的版本,更像是一種「創(chuàng)造力測試」——模型是否具備科學(xué)研究的能力,是否能提出新理論,是否能自洽地解釋自己的推理。
這個標(biāo)準(zhǔn)很高,甚至高到今天所有AI都達不到。
但它至少指向了一個方向:我們真正關(guān)心的,不僅僅是機器能不能說得像人,而更重要的是它有沒有可能在理解世界這件事上,成為我們的伙伴。
參考資料:
https://www.youtube.com/watch?v=o80PeJ0P1YM
https://www.businessinsider.com/sam-altman-openai-david-deutsch-turing-test-for-agi-2025-9
相關(guān)閱讀
-
看點:圖靈測試過時了!奧特曼與量子計...
圖靈測試過時了!奧特曼與量子計算之父提出的2 0來了,奧特曼,物理學(xué)家, -
福建艦滿編上艦有多厲害?期待“不會等...
https: vod fznews com cn common custom 20251114 89da3f71-5f67-492f-9131-7f6512 -
每日看點!中基協(xié)就公募投資者適當(dāng)性征求...
整體來看,《細則》要求基金管理人、基金銷售機構(gòu)應(yīng)當(dāng)依法依規(guī)、勤勉盡 -
海安集團今日新股申購 每日看點
股票名稱:海安集團申購代碼:001233申購價格:48 00元中簽繳款日:202 -
新華指數(shù)|11月13日新華·山東港口硫磺現(xiàn)...
新華財經(jīng)北京11月13日電(石昂)截至2025年11月13日,新華·山東港 -
即時看!朗科科技:公司目前圍繞韶關(guān)數(shù)...
證券日報網(wǎng)訊朗科科技(300042)11月13日在互動平臺回答投資者提問時表
- 看點:圖靈測試過時了!奧特曼與量子計算之2025-11-14
- 今熱點:中國煤炭科工集團增資至43.2億 增2025-11-14
- 每年最高額度360萬元!只限退役軍人及家屬2025-11-14
- 國家統(tǒng)計局:10月份各線城市商品住宅銷售價2025-11-14
- 福建艦滿編上艦有多厲害?期待“不會等太久2025-11-14
- 覽富資訊2025.11.142025-11-14
- 1444.49噸!我國探明首個千噸級金礦-焦點訊息2025-11-14
- 每日看點!中基協(xié)就公募投資者適當(dāng)性征求意2025-11-14
- 今日精選:“挖到寶”了!國內(nèi)首個千噸級超2025-11-14
- 馬爾基西奧退役六年仍保持高強度訓(xùn)練,體能2025-11-14
- 海安集團今日新股申購 每日看點2025-11-14
- 美股三大指數(shù)集體收跌 今日熱文2025-11-14
- 新華指數(shù)|11月13日新華·山東港口硫磺現(xiàn)貨2025-11-13
- 即時看!朗科科技:公司目前圍繞韶關(guān)數(shù)據(jù)中2025-11-13
- 焦點信息:汽車下鄉(xiāng)題材龍頭公司:共二只(22025-11-13
- 焦點快看:師宗縣五龍老楊木材經(jīng)營部(個體2025-11-13
- 焦點快播:南寧楊松科技有限公司成立 注冊2025-11-13
- 金一文化今日大宗交易折價成交1936.55萬股2025-11-13
- PriceSeek重點提醒:山東金嶺二氯甲烷出廠2025-11-13
- 今日觀點!宇環(huán)數(shù)控股東戶數(shù)下降14.25%,戶2025-11-13
- 宇樹科技推出首款輪式人形機器人2025-11-13
- 電解液添加劑價格暴漲,2只龍頭股年內(nèi)股價2025-11-13
- 每日消息!澄清后再獲漲停,奶皮子糖葫蘆火2025-11-13
- 每日頭條!PriceSeek提醒:田豐化工硝酸鉀報2025-11-13
- 光大證券:維持貝殼-W“買入”評級 Q3收入2025-11-13
- 焦點!11月13日午間漲停分析2025-11-13
- 最新發(fā)聲!免密支付:異常,攔截!2025-11-13
- “雙11”爆單 河南保稅物流園區(qū)跨境電商進2025-11-13
- 今日要聞!百度:“羅永浩”同款數(shù)字人技術(shù)2025-11-13
- 當(dāng)前熱議!租房押金退還需要注意什么?2025-11-13








