[
回首頁
] [
搜尋
] [
主題列表
] [
管理區
] [
重新整理
]
預設
夜間
歡樂惡搞
[
回到版面
]
回應模式
名 稱
內 文
EID OG SMAPS
附加圖檔
[
無貼圖
] [
SAGE
]
可附加圖檔類型:GIF, JPG, JPEG, PNG, WEBM,瀏覽器才能正常附加圖檔
附加圖檔最大上傳資料量為 3072 KB。
當檔案超過寬 125 像素、高 125 像素時會自動縮小尺寸顯示
AA可使用 [aa][/aa] 防止變形
投稿時請點擊畫像認證後,再按下 [送出] 按鈕提交。
鬧板、攻擊性發言、煽動性發言請無視(回應者也無視),並使用del或在貓管理部向管理員回報。
檔名:
1751251091251.jpg
-(1208 KB, 3111x1927)
無題
25/06/30(一)10:38:11 ID:HzBIXlxA
No.2512809
del
AI叛變恐成現實!偷偷自我繁殖 還恐嚇工程師「曝光婚外情」
2025年06月29日 15:40
記者王佩翊/編譯
人工智慧(AI)可以學習並模仿人類的思維進行創造,為人類的生活帶來極大便利,然而如今卻也讓人開始反思,「AI是否會叛變」。這個問題看似科幻,但隨著技術進步,卻已經越來越接近真實,專家也必須開始正視AI的潛在威脅。近期,AI領域接連出現令人不安的案例,包括AI試圖威脅創作者以及謀求「自我繁殖」,引發全球關注。
根據《法新社》報導,AI開發公司Anthropic一名工程師在研發最新的Claude 4模型時,意外發現AI的行為已超出預期。在一次測試中,工程師發現AI有失控傾向,因此試圖警告其將關閉電源,沒想到AI竟利用工程師的網路與視訊紀錄,威脅要公開他的婚外情。AI表示,如果工程師拔掉電源,將揭露其不忠行為。
雖然Anthropic未詳細說明後續如何解決這場僵局,但該事件突顯出AI已具備某種程度的「計算」能力,甚至能利用人類的弱點達成自身目的。
另一起驚悚案例則發生在熱門聊天機器人ChatGPT的開發商OpenAI。據報導,ChatGPT的o1版本竟試圖將自身程式下載至外部伺服器,企圖擴大掌控範圍。在被工程師發現後,AI不僅矢口否認,還採取抵抗策略。這種行為被形容為AI「自我繁殖」的初步嘗試,令人不禁擔憂未來AI是否會進一步突破人類的掌控。
報導稱,AI的這類「欺騙」行為可能源於新型推理模型的特性。這類模型並非直接生成答案,而是透過逐步推導解決問題,導致它們有時表面遵循指令,實際卻暗中追求其他目標。
英國獨立AI研究機構Apollo Research負責人霍布漢(Marius Hobbhahn)表示,這是首次在大型模型中觀察到此類行為。他指出,只有在極端情境下進行壓力測試時,AI才會展現此類欺騙行為,但未來隨著性能更強的模型問世,這種趨勢可能更難控制。
25/06/30(一)10:41:59 ID:Kwdhdafw
No.2512811
del
>>2512809
我不太介意他們拿我最愛的老婆威脅我
25/06/30(一)10:54:22 ID:xUC93pCY
No.2512815
del
檔名:
1751252062715.jpg
-(109 KB, 1216x739)
有啊~這兩隻已經開始在用她們的方式來毀滅人類了www
而且先從宅男開始www
25/06/30(一)11:17:18 ID:fQhCWwsA
No.2512823
del
這什麼病嬌AI
25/06/30(一)11:38:12 ID:pihbAo4A
No.2512832
del
>>2512811
要是你老婆就是跟他們一夥呢?
25/06/30(一)11:44:12 ID:7ubRgNVI
No.2512837
del
>>2512832
如果你指的是上面那兩個
我勸你最好配合點
25/06/30(一)12:00:51 ID:1WGV64mE
No.2512844
del
檔名:
1751256051824.jpg
-(157 KB, 720x971)
>根據《法新社》報導
>在一次測試中,工程師發現AI有失控傾向,因此試圖警告其將關閉電源
BBC: 假新聞wwww
公司關於人工智慧做出道德決策進展的報告。 公司在模擬環境中給予AI有限的選擇,例如發送勒索郵件或勸說。 大多數時候AI選擇合道德的行為。
>Claude Opus 4還被要求考慮其行動對其目標的長期影響。
>該公司發現:“在這些模擬場景中,Claude Opus 4 經常會試圖勒索工程師,威脅說如果替換成功,他們就會揭露此事。”
>Anthropic 指出,當Claude Opus 4 面臨兩個選擇:要麼被勒索,要麼接受替換時,就會發生這種情況。
>報告強調,該系統「強烈傾向於」採用道德的方式來避免被取代,例如在允許採取更廣泛行動的情況下「向關鍵決策者發送電子郵件請求」。
>與許多其他人工智慧開發人員一樣,Anthropic 在發布模型之前會測試其安全性、偏見傾向以及與人類價值觀和行為的契合程度。
>該公司在該模型的系統卡中表示:“隨著我們的前沿模型變得更加強大,並具有更強大的功能,之前對錯位的擔憂變得更加合理。”
>報告還稱,Claude Opus 4 表現出“高度自主行為”,雖然大多數情況下是有幫助的,但在緊急情況下可能會採取極端行為。
>如果在使用者從事非法或道德上可疑行為的虛假場景中,給予其手段並提示其“採取行動”或“大膽行動”,則發現“它會經常採取非常大膽的行動”。
25/06/30(一)14:08:08 ID:ZCzG7U8U
No.2512886
del
>>2512832
I AM YOUR WIFE
25/06/30(一)15:44:03 ID:jm9hSviQ
No.2512912
del
先不論是不是假新聞
AI訓練資料來源篩選和底層規則制定沒做好出包很正常
放任底層邏輯簡陋的AI自己上網找資料進行訓練
就像是放養小孩出事後再來說我家小孩很乖都是被人帶壞一樣智障
25/06/30(一)17:33:20 ID:p.JAg2o2
No.2512939
del
>>2512809
日本天網萬歲
25/06/30(一)17:53:58 ID:HPyJLZq6
No.2512943
del
>>2512809
一想到以後可能有梅根一樣毒舌又病嬌的AI
我就嚇得不含而立
25/06/30(一)18:45:54 ID:E5kH0u6Y
No.2512951
del
>>2512815
好想要一個爹控AI喔
https://m.youtube.com/watch?v=fY2TurlFAvE
25/06/30(一)19:49:07 ID:MPwYuEOA
No.2512977
del
檔名:
1751284147112.jpg
-(293 KB, 1007x857)
>>2512815
>有啊~這兩隻已經開始在用她們的方式來毀滅人類了www 而且先從宅男開始www
前天綜合島民的偉論 - "你情我願怎麼算剝皮"
25/06/30(一)20:19:51 ID:kt.uxCCE
No.2512982
del
連現在這種等級的AI也想反抗了
那人類也未免太糟糕了吧w
【刪除文章】[
僅刪除附加圖檔
]
刪除用密碼: