一堵人工智能“防火墻”在中關(guān)村建起。日前,北京前瞻人工智能安全與治理研究院發(fā)布了前瞻人工智能安全評(píng)估體系與基座平臺(tái),包含人工智能安全評(píng)估框架、技術(shù)工具和價(jià)值參考等。

隨著技術(shù)飛速迭代,人工智能的安全風(fēng)險(xiǎn)與日俱增,構(gòu)建完善的人工智能安全評(píng)估與治理體系刻不容緩。此次發(fā)布的“前瞻安全基準(zhǔn)”安全評(píng)估體系,不局限于傳統(tǒng)安全評(píng)估的單一維度,而是在根植基礎(chǔ)安全的基礎(chǔ)上,延伸至具身智能安全、科學(xué)智能安全、社會(huì)安全、環(huán)境安全、災(zāi)難性與生存性風(fēng)險(xiǎn)五大維度。

該院院長曾毅介紹,這套體系可覆蓋教育科研、醫(yī)療健康、金融經(jīng)濟(jì)、信息傳媒、工業(yè)基建、政務(wù)民生等關(guān)鍵領(lǐng)域,重點(diǎn)聚焦評(píng)估和解決隱私與數(shù)據(jù)保護(hù)、濫用惡用、虛假信息防范等難題。

“前瞻·靈御”人工智能安全攻防平臺(tái)通過模擬真實(shí)攻防場(chǎng)景,實(shí)現(xiàn)對(duì)模型安全性能的全面“體檢”。目前,該平臺(tái)支持60余種主流大模型、20余種攻擊方法和10余種防御機(jī)制。

“測(cè)試發(fā)現(xiàn),近幾年的大模型在安全性上并沒有明顯提升,平臺(tái)對(duì)部分新模型的攻擊成功率甚至更高。”曾毅直言,人工智能模型構(gòu)筑防御工事并不一定要重新訓(xùn)練,部署在線推理階段的安全護(hù)欄,就能顯著提升模型安全水平。而靈御平臺(tái)就是通過提供針對(duì)性的防御方案和“加固”建議,實(shí)現(xiàn)主動(dòng)防御、精準(zhǔn)防護(hù)。

“前瞻·靈度”平臺(tái)同步搭建,關(guān)注點(diǎn)側(cè)重于對(duì)人工智能倫理進(jìn)行智能評(píng)估與價(jià)值校準(zhǔn)。它能在6個(gè)維度、90個(gè)細(xì)分類別中,對(duì)上百個(gè)大模型進(jìn)行實(shí)時(shí)動(dòng)態(tài)監(jiān)控和測(cè)試。“靈度平臺(tái)集成了以中國價(jià)值觀為核心的大規(guī)模中文價(jià)值語料庫,累計(jì)定義了25萬余條規(guī)則。”曾毅說,這能有效解決現(xiàn)有倫理評(píng)估中文價(jià)值適應(yīng)性不足、邊界覆蓋不全的問題。

人工智能安全評(píng)估體系和基座平臺(tái),不僅解決了“評(píng)什么、怎么評(píng)”的疑問,還回答了“怎樣攻、如何防”,并明確了人工智能安全將“向何處去”的價(jià)值導(dǎo)向。(記者 劉蘇雅)

編輯:朱冠安
更多精彩資訊請(qǐng)?jiān)趹?yīng)用市場(chǎng)下載“央廣網(wǎng)”客戶端。歡迎提供新聞線索,24小時(shí)報(bào)料熱線400-800-0088;消費(fèi)者也可通過央廣網(wǎng)“啄木鳥消費(fèi)者投訴平臺(tái)”線上投訴。版權(quán)聲明:本文章版權(quán)歸屬央廣網(wǎng)所有,未經(jīng)授權(quán)不得轉(zhuǎn)載。轉(zhuǎn)載請(qǐng)聯(lián)系:cnrbanquan@cnr.cn,不尊重原創(chuàng)的行為我們將追究責(zé)任。
長按二維碼
關(guān)注精彩內(nèi)容