ChatGPT 的深入研究就在這里。但它真的能取代人類專家嗎?

OpenAI 的 '深入研究' 是最新的人工智能(AI) 工具掀起波瀾并承諾在幾分鐘內(nèi)完成人類專家需要數(shù)小時(shí)才能完成的工作。

作為 ChatGPT Pro 和銷售作為可以匹配訓(xùn)練有素的分析師的研究助理,它可以自主搜索 Web、編譯來(lái)源并提供結(jié)構(gòu)化報(bào)告。它甚至得分26.6% 的 Humanity's Last Exam (HLE),這是一個(gè)嚴(yán)格的 AI 基準(zhǔn)測(cè)試,跑贏大盤(pán)許多型號(hào)。

但深入的研究并不完全符合炒作。雖然它生成的報(bào)告很精美,但也存在嚴(yán)重的缺陷。據(jù)記者報(bào)道誰(shuí)嘗試過(guò),深入的研究可能會(huì)錯(cuò)過(guò)關(guān)鍵細(xì)節(jié),與最新信息作斗爭(zhēng),有時(shí)還會(huì)捏造事實(shí)。

Open AI 的深度研究助手可以處理數(shù)據(jù),但不能像人腦那樣了解事物。(伊納基·德?tīng)枴W爾莫/Unsplash)

OpenAI 在列出其工具的局限性時(shí)標(biāo)記了這一點(diǎn)。該公司還表示“根據(jù)內(nèi)部評(píng)估,有時(shí)會(huì)在回答中產(chǎn)生幻覺(jué)或做出錯(cuò)誤的推斷,盡管其比率明顯低于現(xiàn)有的 ChatGPT 模型”。

不可靠的數(shù)據(jù)可能會(huì)溜進(jìn)來(lái)也就不足為奇了,因?yàn)?AI 模型不像人類那樣“了解”事物。

人工智能“研究分析師”的想法也引發(fā)了一系列問(wèn)題。機(jī)器 - 無(wú)論多么強(qiáng)大 - 真的可以取代訓(xùn)練有素的專家嗎?這對(duì)知識(shí)工作有什么影響?AI 真的是幫助我們更好地思考,還是只是讓我們更容易完全停止思考?

什么是“深度研究”,它適用于誰(shuí)?

深入研究面向金融、科學(xué)、政策、法律和工程領(lǐng)域的專業(yè)人士,以及學(xué)者、記者和商業(yè)戰(zhàn)略家,是最新的”代理經(jīng)驗(yàn)“ OpenAI 已在 ChatGPT 中推出。它承諾在幾分鐘內(nèi)完成繁重的研究工作。

目前,深度研究?jī)H適用于美國(guó)的 ChatGPT Pro 用戶,每月費(fèi)用為 200 美元。開(kāi)放人工智能說(shuō)它將在未來(lái)幾個(gè)月內(nèi)向 Plus、Team 和 Enterprise 用戶推出,并計(jì)劃在未來(lái)推出更具成本效益的版本。

與提供快速響應(yīng)的標(biāo)準(zhǔn)聊天機(jī)器人不同,深度研究遵循多步驟流程來(lái)生成結(jié)構(gòu)化報(bào)告:

  1. 用戶提交請(qǐng)求。這可以是從市場(chǎng)分析到法律案例摘要的任何內(nèi)容。
  2. AI 澄清任務(wù)。它可能會(huì)提出后續(xù)問(wèn)題以完善研究范圍。
  3. 代理搜索 Web。它可以自主瀏覽數(shù)百個(gè)來(lái)源,包括新聞文章、研究論文和在線數(shù)據(jù)庫(kù)。
  4. 它綜合了它的發(fā)現(xiàn)。AI 提取關(guān)鍵點(diǎn),將它們組織成結(jié)構(gòu)化報(bào)告并引用其來(lái)源。
  5. 最終報(bào)告已交付。在 5 到 30 分鐘內(nèi),用戶會(huì)收到一個(gè)多頁(yè)文檔 –甚至可能獲得博士學(xué)位的論文– 總結(jié)調(diào)查結(jié)果。

乍一看,它聽(tīng)起來(lái)像是知識(shí)工作者的夢(mèng)想工具。仔細(xì)觀察會(huì)發(fā)現(xiàn)明顯的局限性。

測(cè)試暴露出的缺點(diǎn):

  • 它缺乏背景。AI 可以總結(jié),但它并不完全理解什么是重要的。
  • 它忽略了新的發(fā)展。它錯(cuò)過(guò)了重大的法律裁決和科學(xué)更新。
  • 它編造了一切。與其他 AI 模型一樣,它可以自信地生成虛假信息。
  • 它無(wú)法區(qū)分事實(shí)和虛構(gòu)。它沒(méi)有區(qū)分權(quán)威來(lái)源和不可靠的來(lái)源。

雖然 OpenAI 聲稱其工具可與人類分析師相媲美,但 AI 不可避免地缺乏使優(yōu)秀研究有價(jià)值的判斷力、審查力和專業(yè)知識(shí)。

AI 無(wú)法取代什么

ChatGPT 并不是唯一一個(gè)只需幾個(gè)提示就可以搜索網(wǎng)絡(luò)并生成報(bào)告的 AI 工具。值得注意的是,僅僅OpenAI 發(fā)布 24 小時(shí)后中,Hugging Face 發(fā)布了一個(gè)免費(fèi)的開(kāi)源版本,其性能幾乎與之相當(dāng)。

深度研究和其他用于“人類水平”研究的 AI 工具的最大風(fēng)險(xiǎn)是 AI 可以取代人類思維的錯(cuò)覺(jué)。AI 可以總結(jié)信息,但它不能質(zhì)疑自己的假設(shè)、突出知識(shí)差距、創(chuàng)造性思考或理解不同的觀點(diǎn)。

AI 在建立對(duì)復(fù)雜研究問(wèn)題的深刻理解方面尚未超越人類。(伊利亞·哈伊爾/Unsplash)

AI 生成的摘要與深度熟練人類研究人員。

任何 AI 代理,無(wú)論多快,都只是一種工具,而不是人類智能的替代品。對(duì)于知識(shí)工作者來(lái)說(shuō),投資于 AI 無(wú)法復(fù)制的技能比以往任何時(shí)候都更加重要:批判性思維、事實(shí)核查、深厚的專業(yè)知識(shí)和創(chuàng)造力。

如果您確實(shí)想使用 AI 研究工具,有一些方法可以負(fù)責(zé)任地這樣做。深思熟慮地使用 AI 可以在不犧牲準(zhǔn)確性或深度的情況下增強(qiáng)研究。您可以使用 AI 來(lái)提高效率,例如總結(jié)文檔,但保留人工判斷來(lái)做出決策。

始終驗(yàn)證來(lái)源,因?yàn)?AI 生成的引用可能會(huì)產(chǎn)生誤導(dǎo)。不要盲目相信結(jié)論,而是應(yīng)用批判性思維并與信譽(yù)良好的來(lái)源交叉核對(duì)信息。對(duì)于高風(fēng)險(xiǎn)主題 — 例如健康,正義民主— 用專家意見(jiàn)補(bǔ)充 AI 發(fā)現(xiàn)。

盡管大量的營(yíng)銷試圖告訴我們并非如此,但生成式 AI 仍然有很多局限性。能夠創(chuàng)造性地綜合信息、挑戰(zhàn)假設(shè)和批判性思考的人類將繼續(xù)受到需求——AI 目前還不能取代他們。

Raffaele F Ciriello, 商業(yè)信息系統(tǒng)高級(jí)講師,悉尼大學(xué)

本文轉(zhuǎn)載自對(duì)話根據(jù) Creative Commons 許可。閱讀原創(chuàng)文章.

寶寶起名 起名

本站所有相關(guān)知識(shí)僅供大家參考、學(xué)習(xí)之用,部分來(lái)源于互聯(lián)網(wǎng),其版權(quán)均歸原作者及網(wǎng)站所有,如無(wú)意侵犯您的權(quán)利,請(qǐng)與小編聯(lián)系,我們將會(huì)在第一時(shí)間核實(shí)并給予反饋。
相關(guān)期刊推薦
湖北農(nóng)機(jī)化

湖北農(nóng)機(jī)化

農(nóng)業(yè)基礎(chǔ)科學(xué) - 省級(jí)期刊

文學(xué)教育

文學(xué)教育

中國(guó)文學(xué) - 省級(jí)期刊

文藝生活

文藝生活

合作期刊 - 省級(jí)期刊

山東工業(yè)技術(shù)

山東工業(yè)技術(shù)

合作期刊 - 省級(jí)期刊

教書(shū)育人

教書(shū)育人

合作期刊 - 省級(jí)期刊

經(jīng)濟(jì)視野

經(jīng)濟(jì)視野

企業(yè)經(jīng)濟(jì) - 國(guó)家級(jí)期刊

新課程導(dǎo)學(xué)

新課程導(dǎo)學(xué)

合作期刊 - 省級(jí)期刊

農(nóng)村經(jīng)濟(jì)與科技

農(nóng)村經(jīng)濟(jì)與科技

農(nóng)業(yè)綜合 - 省級(jí)期刊

中國(guó)高新科技

中國(guó)高新科技

合作期刊 - 國(guó)家級(jí)期刊

小學(xué)教學(xué)參考

小學(xué)教學(xué)參考

合作期刊 - 省級(jí)期刊

農(nóng)技服務(wù)

農(nóng)技服務(wù)

農(nóng)業(yè)基礎(chǔ)科學(xué) - 省級(jí)期刊