ChatGPT 的深入研究就在這里。但它真的能取代人類專家嗎？

OpenAI 的 '深入研究' 是最新的人工智能（AI）工具掀起波瀾并承諾在幾分鐘內(nèi)完成人類專家需要數(shù)小時才能完成的工作。

作為 ChatGPT Pro 和銷售作為可以匹配訓(xùn)練有素的分析師的研究助理，它可以自主搜索 Web、編譯來源并提供結(jié)構(gòu)化報告。它甚至得分26.6% 的 Humanity's Last Exam （HLE），這是一個嚴(yán)格的 AI 基準(zhǔn)測試，跑贏大盤許多型號。

但深入的研究并不完全符合炒作。雖然它生成的報告很精美，但也存在嚴(yán)重的缺陷。據(jù)記者報道誰嘗試過，深入的研究可能會錯過關(guān)鍵細(xì)節(jié)，與最新信息作斗爭，有時還會捏造事實。

Open AI 的深度研究助手可以處理數(shù)據(jù)，但不能像人腦那樣了解事物。(伊納基·德爾·奧爾莫/Unsplash)

OpenAI 在列出其工具的局限性時標(biāo)記了這一點。該公司還表示“根據(jù)內(nèi)部評估，有時會在回答中產(chǎn)生幻覺或做出錯誤的推斷，盡管其比率明顯低于現(xiàn)有的 ChatGPT 模型”。

不可靠的數(shù)據(jù)可能會溜進(jìn)來也就不足為奇了，因為 AI 模型不像人類那樣“了解”事物。

人工智能“研究分析師”的想法也引發(fā)了一系列問題。機器 - 無論多么強大 - 真的可以取代訓(xùn)練有素的專家嗎？這對知識工作有什么影響？AI 真的是幫助我們更好地思考，還是只是讓我們更容易完全停止思考？

什么是“深度研究”，它適用于誰？

深入研究面向金融、科學(xué)、政策、法律和工程領(lǐng)域的專業(yè)人士，以及學(xué)者、記者和商業(yè)戰(zhàn)略家，是最新的”代理經(jīng)驗“ OpenAI 已在 ChatGPT 中推出。它承諾在幾分鐘內(nèi)完成繁重的研究工作。

目前，深度研究僅適用于美國的 ChatGPT Pro 用戶，每月費用為 200 美元。開放人工智能說它將在未來幾個月內(nèi)向 Plus、Team 和 Enterprise 用戶推出，并計劃在未來推出更具成本效益的版本。

與提供快速響應(yīng)的標(biāo)準(zhǔn)聊天機器人不同，深度研究遵循多步驟流程來生成結(jié)構(gòu)化報告：

用戶提交請求。這可以是從市場分析到法律案例摘要的任何內(nèi)容。
AI 澄清任務(wù)。它可能會提出后續(xù)問題以完善研究范圍。
代理搜索 Web。它可以自主瀏覽數(shù)百個來源，包括新聞文章、研究論文和在線數(shù)據(jù)庫。
它綜合了它的發(fā)現(xiàn)。AI 提取關(guān)鍵點，將它們組織成結(jié)構(gòu)化報告并引用其來源。
最終報告已交付。在 5 到 30 分鐘內(nèi)，用戶會收到一個多頁文檔 –甚至可能獲得博士學(xué)位的論文– 總結(jié)調(diào)查結(jié)果。

乍一看，它聽起來像是知識工作者的夢想工具。仔細(xì)觀察會發(fā)現(xiàn)明顯的局限性。

多早測試暴露出的缺點：