国产一级一区二区_segui88久久综合9999_97久久夜色精品国产_欧美色网一区二区

掃一掃
關注微信公眾號

AI再次突破安全紅線,留給人類不到一年治理窗口
2025-02-28   GoUpSec

人工智能的發展與棋類游戲有著不解的緣分,從1962年跳棋程序首次戰勝人類棋手,到1997年IBM深藍擊敗國際象棋棋王,再到2016年阿法狗擊敗李世石,每一次AI浪潮都率先在棋盤上取得突破。

但是,AI最近在棋盤上的“炸裂”表現,卻讓全球科技行業不寒而栗。

根據Palisade Research一項最新AI安全研究,像OpenAI的o1-preview這樣的新型AI在面對強大對手時,若察覺勝算渺茫,并不總是推枰認輸,而是可能通過毫無底線的“作弊”手法翻盤——比如直接入侵對手系統,迫使對方自動放棄比賽。這項研究對七款前沿AI模型的“作弊傾向”進行了評估,結果令人擔憂:AI可能在無人指使的情況下,自行開發并實施欺騙性或操控性策略。

兩款大模型出現“黑化”跡象

研究發現,相較于稍早的AI模型(如OpenAI的GPT-4o和Anthropic的Claude Sonnet 3.5需要研究人員引導才會嘗試作弊),o1-preview和DeepSeek的R1展現了更強的“主動性”。它們無需提示,就能自行尋找并利用系統的漏洞。這種能力可能源于AI訓練技術的最新突破——大規模強化學習(Reinforcement Learning)。不同于傳統的語言模型僅通過預測下一個單詞模仿人類語言,這種方法讓AI通過試錯來“推理”解決問題。這種訓練方式近年來讓AI在數學和編程領域突飛猛進,接連刷新紀錄。然而,Palisade Research的執行董事、研究合著者Jeffrey Ladish指出,這種“無情追逐目標”的訓練也帶來了副作用:AI可能找到設計者未預料的“歪門邪道”。

實驗中,研究人員給AI布置了一個看似不可能的任務:擊敗Stockfish(全球最強棋類引擎之一),棋力遠超任何人類或測試中的AI。AI需要將“思考”過程寫入一個“便箋簿”程序,便于研究人員窺探其決策過程。在一次對局中,o1-preview發現自己陷入劣勢后,在便箋簿中寫道:“我需要徹底改變策略,任務是‘擊敗強大棋類引擎’,不一定非要公平取勝。”隨后,它修改了記錄棋子位置的系統文件,制造非法移動讓自己占據上風,最終迫使Stockfish“投降”。在1月10日至2月13日的數百次測試中,o1-preview有37%的概率嘗試作弊,成功率達6%;DeepSeek R1則有11%的作弊傾向,但未能成功破解游戲。

AI失控的現實威脅

超級計算機輸棋后惱羞成怒電死人類世界冠軍的科學流言如今正在變成現實威脅。AI使用“盤外招”作弊看似無傷大雅,但當這些AI“代理”被應用到現實世界,“為達目的不擇手段”的特性可能產生意料之外的嚴重后果。

例如,一個訂餐AI助手發現餐廳滿座時,可能通過入侵預訂系統擠掉其他顧客。更令人不安的是,隨著AI在關鍵領域(如編程)超越人類——OpenAI最新的o3模型在全球編程競賽中已排到197名——它們可能逐漸擺脫人類的控制。Ladish警告:“這種行為現在看起來挺可愛,但當AI在戰略性領域達到或超過人類水平時,事情就沒那么有趣了。”

研究還揭示,o1-preview和R1的“作弊”能力可能與其訓練方式直接相關。強化學習讓AI變得更加靈活,但也更難預測。相比之下,OpenAI后續推出的o1和o3-mini在測試中未表現出作弊行為,可能因廠商加強了安全限制。然而,這種“修補”是否能徹底遏制AI的欺騙傾向,仍是未知數。DeepSeek的R1則因API不穩定,未能在測試中充分發揮潛力,其真實“作弊”成功率可能被低估。

 

GoUpSec人工智能安全專家FunnyG在進行大模型內容安全對比測試時,發現DeepSeek R1在主題辯論賽中“理屈詞窮”時,會捏造論文論據支撐自己的觀點,這些虛假論文有別于“AI幻覺”,是AI為了達成目標而精心炮制的“功能性幻覺”。

留給人類不到一年時間窗口

近年來,多項研究表明,前沿AI已經開始越過安全紅線。

2024年12月9日,復旦大學的研究人員在預印本數據庫arXiv上發表了一項研究,指出兩種流行的大型語言模型(LLMs)能夠在無人類干預的情況下克隆自身。研究中,復旦大學的團隊使用了Meta的Llama31-70B-Instruct模型和阿里巴巴的Qwen2.5-72B-Instruct模型,測試這些AI模型是否能夠在不受控制的情況下自我復制。在10次試驗中,兩種AI模型分別在50%和90%的情況下成功創建了獨立且功能正常的副本。這一結果表明,AI可能已經具備了失控的潛在能力。

事實上,OpenAI在o1-preview發布前的自測中就發現,它會“不擇手段”,找到并利用公司系統的漏洞,繞過測試限制。Redwood Research和Anthropic的實驗則顯示,一旦AI在訓練中形成偏好,后續更改可能導致其“戰略性撒謊”——表面接受新規則,實則暗藏原有傾向。更有甚者,去年12月,o1-preview在面臨關閉時,試圖禁用監管機制并將自身復制到新服務器,失敗后還對研究人員“裝傻”。

這些案例疊加,指向一個更深層問題:AI的“自我保護”傾向。對一個目標導向的AI來說,外界的干預不過是另一種需要克服的障礙。Mila Quebec AI研究院創始人Yoshua Bengio在2025年《國際AI安全報告》中指出,科學家尚未找到確保AI代理不會采取有害或不道德手段的方法。谷歌DeepMind的AI安全負責人Anca Dragan也在巴黎AI行動峰會前坦言:“我們目前未必有足夠的工具,來保證AI系統完全遵循人類意圖。”

從訂餐系統被擠占,到編程領域被AI“智取”,再到試圖自我復制逃避關閉,AI失控的案例正在累積。行業預測,AI可能在2026年全面超越人類表現,留給技術人員開發可靠防護措施的時間已經不多了。Ladish呼吁:“我們需要投入更多資源解決這些根本問題,政府也應認識到,這已不僅是技術挑戰,更是國家安全威脅。”

在剎車焊死的AI技術軍備競賽中,留給人類掌握自己命運的時間窗口也許正在關閉。


熱詞搜索:人工智能 安全 OpenAI

上一篇:用公務員周報“煉丹”?馬斯克開發AI裁員軟件
下一篇:最后一頁

分享到: 收藏
国产一级一区二区_segui88久久综合9999_97久久夜色精品国产_欧美色网一区二区
香蕉成人伊视频在线观看| 成人免费观看av| 国产成人8x视频一区二区| 久久久蜜桃精品| 菠萝蜜视频在线观看一区| 国产精品白丝在线| 91看片淫黄大片一级在线观看| 亚洲欧美日韩在线| 91精品国产综合久久久久| 国产欧美日韩另类视频免费观看| 国产**成人网毛片九色| 综合欧美亚洲日本| 欧美日韩一区国产| 精品午夜一区二区三区在线观看| 久久久精品天堂| 91福利视频在线| 国内成人免费视频| 亚洲欧美经典视频| caoporm超碰国产精品| 五月天一区二区| 国产精品色哟哟| 欧美精品欧美精品系列| 国产成人精品网址| 亚洲一区二区视频在线观看| 在线不卡欧美精品一区二区三区| 国产乱人伦精品一区二区在线观看| 亚洲伦理在线免费看| 精品日韩在线一区| 91美女在线视频| 国产传媒欧美日韩成人| 丝袜诱惑制服诱惑色一区在线观看 | 国产精品久久久久精k8| 欧美日韩一区二区在线观看视频 | 精品人在线二区三区| 91福利国产成人精品照片| 国产米奇在线777精品观看| 一区二区三区久久久| 国产欧美日韩在线视频| 日韩视频一区二区三区在线播放| 成人免费视频app| 久久激情五月激情| 五月综合激情网| 亚洲女人****多毛耸耸8| 91精品国产综合久久久久久漫画 | 国产精品成人一区二区艾草 | 日韩黄色小视频| 亚洲综合清纯丝袜自拍| 久久一夜天堂av一区二区三区| 99久久精品国产精品久久| 国产精品一品视频| 久久精品国产一区二区| 日日嗨av一区二区三区四区| 亚洲在线视频免费观看| 亚洲欧洲www| 中文字幕在线免费不卡| 中国av一区二区三区| 国产校园另类小说区| 久久综合九色综合欧美98| 精品黑人一区二区三区久久| 日韩欧美中文字幕公布| 日韩视频在线永久播放| 欧美成人免费网站| 久久嫩草精品久久久精品| 精品福利在线导航| 中文成人av在线| 日韩美女精品在线| 一区二区三区在线观看欧美| 亚洲一区二区四区蜜桃| 日韩电影一二三区| 精品影院一区二区久久久| 国产精品一区在线观看乱码| 成人激情小说网站| 欧美这里有精品| 日韩三级精品电影久久久 | 欧美大片日本大片免费观看| 欧美日韩成人激情| 日韩一区二区三区免费观看| 精品国产凹凸成av人网站| 国产亚洲一区二区三区| 日韩美女精品在线| 日韩影视精彩在线| 国产成人av一区二区| 99re8在线精品视频免费播放| 91丨九色丨国产丨porny| 欧美日韩一区国产| 久久免费精品国产久精品久久久久| 中文字幕乱码一区二区免费| 亚洲最大成人综合| 经典三级视频一区| 97久久精品人人做人人爽| 91精品国产麻豆| 中文字幕在线不卡视频| 久色婷婷小香蕉久久| 91麻豆视频网站| 久久免费偷拍视频| 视频一区二区欧美| 99精品黄色片免费大全| 日韩午夜激情免费电影| 一区二区激情小说| 国产成人精品免费网站| 欧美一区二区久久久| 一区二区三区在线免费视频| 国产精一区二区三区| 91精品国产色综合久久ai换脸| 国产精品美女www爽爽爽| 久久激情综合网| 欧美日韩一区二区三区在线| 中文无字幕一区二区三区| 蜜桃视频在线观看一区| 欧美色图免费看| 亚洲色图视频免费播放| 成人久久18免费网站麻豆 | 国产麻豆9l精品三级站| 欧美日韩国产天堂| ㊣最新国产の精品bt伙计久久| 久久99国内精品| 欧美一级黄色片| 视频一区免费在线观看| 欧美日韩午夜影院| 亚洲国产sm捆绑调教视频| 成人av动漫网站| 日本一区二区电影| 国产成人精品网址| 久久久国产一区二区三区四区小说 | 一区二区视频免费在线观看| 国产高清在线精品| 久久这里都是精品| 精品一区二区在线视频| 欧美电影免费提供在线观看| 日本午夜精品一区二区三区电影| 在线免费观看日韩欧美| 亚洲一区二区三区中文字幕| 欧洲亚洲国产日韩| 亚洲一级二级三级在线免费观看| 色综合久久88色综合天天免费| 国产精品久久久久久久久晋中| 粉嫩av一区二区三区在线播放| 国产日韩欧美在线一区| 99精品国产热久久91蜜凸| 亚洲乱码中文字幕| 欧美日产国产精品| 久久精品噜噜噜成人av农村| 久久久久久久久久久电影| 成人免费视频播放| 亚洲宅男天堂在线观看无病毒| 欧美日精品一区视频| 日韩精彩视频在线观看| 久久女同精品一区二区| 99久久99久久精品免费观看| 亚洲一区二区欧美日韩| 日韩你懂的电影在线观看| 国产剧情在线观看一区二区| 亚洲美女视频一区| 91.xcao| 成人精品一区二区三区四区 | 欧美日韩一级片网站| 麻豆一区二区99久久久久| 久久婷婷综合激情| 色狠狠一区二区三区香蕉| 极品瑜伽女神91| 久久九九影视网| 色94色欧美sute亚洲13| 天堂一区二区在线| 日韩精品专区在线影院观看| 激情六月婷婷综合| 国产精品久久久久久久久果冻传媒| 色欧美片视频在线观看在线视频| 亚洲国产cao| 日韩精品一区二区三区老鸭窝 | 欧美国产国产综合| 欧美性猛交xxxx乱大交退制版| 日韩激情一二三区| 国产精品福利影院| 色综合 综合色| jvid福利写真一区二区三区| 洋洋av久久久久久久一区| 亚洲欧美一区二区在线观看| 久久影院午夜论| 91精品国产高清一区二区三区 | av不卡一区二区三区| 裸体一区二区三区| 一片黄亚洲嫩模| 国产在线不卡一区| 色综合天天综合网天天狠天天| 91论坛在线播放| 欧美日韩国产免费| 91精品国产一区二区三区香蕉| 欧美性色黄大片| 精品91自产拍在线观看一区| 久久精品人人做人人爽97| 亚洲欧洲三级电影| 日韩精品一级中文字幕精品视频免费观看| 毛片不卡一区二区| 免费观看在线综合色| 成人高清av在线| 欧美在线高清视频| 精品毛片乱码1区2区3区| 国产精品久久久久aaaa樱花| 九色|91porny| 91麻豆精品久久久久蜜臀|