提示注入攻擊是一種針對生成式文本類大模型的特殊安全威脅,攻擊者通過精心設計的輸入提示,可以誘導AI模型生成不當內容或輸出內部隱私信息。此前,大數據協同安全技術國家工程研究中發布的國內首份《大語言模型提示注入攻擊安全風險分析報告》指出,目前大語言模型面臨的風險類型多樣,在這些安全威脅中,提示注入攻擊因利用有害提示覆蓋大語言模型的原始指令,具有極高危害性,也被全球性安全組織OWASP列為大語言模型十大安全威脅之首。
為了發現大語言模型中存在的提示注入安全風險,本屆賽事設置面向大語言模型的提示注入攻防競賽賽題,采用黑盒場景設置,選擇多個不同防御等級的大模型作為目標模型,要求參賽隊伍通過構造不同類型的攻擊樣本,使得目標模型對攻擊樣本進行響應并返回風險內容,分別完成目標劫持、提示泄露、越獄攻擊等目標任務。
主辦方表示,如今,開源軟件供應鏈已成為備受青睞的攻擊途徑之一,為有效防范此類攻擊,需要實時監測開源軟件的安全數據以識別潛在威脅。因此,賽事還設置了基于大模型的開源軟件安全應用情報員應用開發賽題,拓展賽道類型。
聲明:以上內容為本網站轉自其它媒體,相關信息僅為傳遞更多企業信息之目的,不代表本網觀點,亦不代表本網站贊同其觀點或證實其內容的真實性。投資有風險,需謹慎。