導讀 據外媒報道,韓國研究人員最近开發了一種基於暗網數據訓練的大型語言模型DarkBERT。這個AI模型旨在幫助網絡安全專業人員從暗網提取有關網絡威脅的情報。DarkBERT可以研究暗網,以識別和標記潛在...
據外媒報道,韓國研究人員最近开發了一種基於暗網數據訓練的大型語言模型DarkBERT。這個AI模型旨在幫助網絡安全專業人員從暗網提取有關網絡威脅的情報。
DarkBERT可以研究暗網,以識別和標記潛在的網絡安全威脅,包括數據泄露和勒索軟件。
韓國科學技術院(KAIST)的研究人員與數據情報機構S2W开展合作,开發出生成式AI語言模型DarkBERT,該模型專門針對來自暗網的數據集進行訓練。
與ChatGPT或Bard之類的聊天機器人不同,該模型旨在創建一個工具來分析數據集並回答特定的查詢。DarkBERT可以驗證使用暗網作爲數據集是否能讓AI工具更好地理解這些環境中使用的語言,從而可以爲網絡安全專業人員和執法部門提供幫助。
研究人員使用Tor網絡訓練AI模型
爲了優化DarkBert適應暗網上使用的語言,研究小組通過爬行代理Tor網絡創建了一個大型數據庫。該研究團隊還採用重復數據刪除、數據過濾和預處理技術,以減輕與暗網內容相關的道德擔憂,而暗網內容通常包含大量敏感信息。
該模型在16天內輸入了兩組數據,其中預處理的數據包括受害組織的名稱、泄露數據的詳細信息、威脅聲明、非法圖像等信息。
由於暗網的信息存在潛在風險,DarkBert在短期內不會向公衆开放。然而,用戶可以提出將這個AI模型用於學術目的的請求。
標題:DarkBERT:誕生自暗網的AI,全球首個基於暗網訓練的AI模型
地址:https://www.utechfun.com/post/216766.html