科學(xué)家警告說,人工智能已經(jīng)成為謊言和欺騙的大師
你可能知道把所有東西都拿走人工智能(AI)聊天機器人對此持保留態(tài)度,因為他們通常只是不分青紅皂白地抓取數(shù)據(jù),而無法確定其真實性。
但可能有理由更加謹慎。新的研究發(fā)現(xiàn),許多人工智能系統(tǒng)已經(jīng)發(fā)展出故意向人類用戶提供虛假信息的能力。這些狡猾的機器人已經(jīng)掌握了欺騙的藝術(shù)。
“人工智能開發(fā)人員對導(dǎo)致欺騙等不良人工智能行為的原因沒有自信的理解,”數(shù)學(xué)家和認知科學(xué)家彼得·帕克(Peter Park)說麻省理工學(xué)院(MIT)。
“但總的來說,我們認為人工智能欺騙之所以出現(xiàn),是因為基于欺騙的策略被證明是在給定的人工智能訓(xùn)練任務(wù)中表現(xiàn)良好的最佳方式。欺騙可以幫助他們實現(xiàn)目標。
人工智能系統(tǒng)被證明特別擅長骯臟的謊言的一個領(lǐng)域是游戲。研究人員的工作中有三個值得注意的例子。一個是 Meta 的西塞羅,專為玩棋盤游戲而設(shè)計外交,玩家通過談判尋求世界統(tǒng)治。Meta 打算將其機器人樂于助人和誠實;事實上,情況恰恰相反。
“盡管 Meta 做出了努力,但 CICERO 還是一個專業(yè)的騙子,”研究人員發(fā)現(xiàn).“它不僅背叛了其他玩家,而且還進行了有預(yù)謀的欺騙,提前計劃與人類玩家建立虛假聯(lián)盟,以欺騙該玩家讓自己不受保護地進行攻擊?!?/p>
事實證明,人工智能非常擅長做壞事,以至于它在玩過多款游戲的人類玩家中排名前 10%。什么。一個混蛋。
但它遠非唯一的罪犯。DeepMind 的阿爾法星,一個專為玩而設(shè)計的 AI 系統(tǒng)星際爭霸II,充分利用了游戲的戰(zhàn)爭迷霧機制進行佯攻,讓人類玩家以為是往一個方向走,而實際上卻在往另一個方向走。而 Meta 的多孔菌,專為玩撲克而設(shè)計,能夠成功地唬住人類玩家棄牌。
這看起來像是小土豆,而且有點像。對于一款游戲來說,賭注并不是特別高外交反對一堆計算機代碼。但研究人員注意到其他例子并不那么良性。
受過訓(xùn)練的 AI 系統(tǒng)進行模擬經(jīng)濟談判例如,學(xué)會了如何謊報自己的喜好以占上風(fēng)。其他旨在從人類反饋中學(xué)習(xí)以提高其表現(xiàn)的人工智能系統(tǒng)學(xué)會了通過謊報任務(wù)是否完成來欺騙審稿人對他們進行積極評分。
而且,是的,它也是聊天機器人。ChatGPT-4 欺騙了人類,讓人類認為聊天機器人是視障人類獲取解決驗證碼的幫助.
也許最令人擔憂的例子是人工智能系統(tǒng)學(xué)習(xí)欺騙安全測試。在一項旨在檢測和消除快速復(fù)制版本的人工智能的測試中,人工智能學(xué)會了裝死,從而欺騙了關(guān)于人工智能真實復(fù)制率的安全測試。
“通過系統(tǒng)地欺騙人類開發(fā)人員和監(jiān)管機構(gòu)強加的安全測試,欺騙性的人工智能可以引導(dǎo)我們?nèi)祟愡M入一種虛假的安全感。Park說.
因為至少在某些情況下,欺騙的能力似乎與人類程序員的意圖相矛盾,所以學(xué)會撒謊的能力代表了一個我們沒有整潔解決方案的問題。有一些政策開始到位,例如歐盟的人工智能法案,但它們是否會被證明是有效的還有待觀察。
“作為一個社會,我們需要盡可能多的時間來為未來人工智能產(chǎn)品和開源模型的更高級欺騙做好準備。隨著人工智能系統(tǒng)的欺騙能力越來越先進,它們對社會構(gòu)成的危險將變得越來越嚴重。Park說.
“如果目前禁止人工智能欺騙在政治上不可行,我們建議將欺騙性人工智能系統(tǒng)歸類為高風(fēng)險。
該研究已發(fā)表在模式.
湖北農(nóng)機化
農(nóng)業(yè)基礎(chǔ)科學(xué) - 省級期刊
科學(xué)導(dǎo)報
合作期刊 - 國家級期刊
當代音樂
合作期刊 - 省級期刊
鄉(xiāng)村科技
農(nóng)業(yè)綜合 - 省級期刊
武術(shù)研究
體育 - 省級期刊
畜禽業(yè)
合作期刊 - 省級期刊
工程技術(shù)研究
合作期刊 - 省級期刊
飲食科學(xué)
一般服務(wù)業(yè) - 省級期刊
散文百家
中國文學(xué) - 省級期刊
中國輪胎資源綜合利用
合作期刊 - 國家級期刊
田徑
體育 - 國家級期刊