作者 | Xuushan,編輯 |Evan
“
成立不到7月,估值已過億。
”前有三位90後創辦的Cohere估值衝向360億美元,後有95後郭文景創辦的Pika拿到55億美元估值。很顯然,硅谷裏的AI創業潮正在影響所有人,00後Leonard Tang也是被裹挾進去的萬分之一。
Leonard Tang是AI安全創企 Haize Labs 的創始人兼CEO,也是今年哈佛大學本科畢業生。
他創辦的Haize Labs通過一段視頻展示了AI大模型安全防线的“脆弱”。只需短短幾行提示,就能繞過大模型的安全限制,從而讓AI大模型生成大量的色情文字、血腥圖片等,甚至可以自動攻擊其他網絡。
目前,Haize Labs主要通過其打造的首款AI產品——自動化套件Haizing。該套件主要通過攻擊AI大模型進行壓力測試,以發現AI大模型的安全漏洞。據外媒winbuzzer報道,明星AI創企Anthropic、Scale AI均是其客戶。
Haize Labs成立於2023年12月,在成立不到7個月的時間裏,Haize Labs就收到至少四份投資意向書,知名基金Coatue也參與其中。知情人士透露,Haize Labs已經獲得了General Catalyst領投的最新投資,估值達到1億美元。
在短短1-2輪融資中就獲得高額估值,這般融資速度和規模業內都少見。一方面可以看出,投資者對Haize Labs信心十足,另一方面也顯示了AI安全賽道的潛力。
國際調研機構CB Insight報告顯示,機器學習安全市場(MLSec)正快速增長。2023年AI安全創企投融資總額高達2.13億美元,遠超於2022年的7000萬美元。
據硅兔賽跑不完全統計,2024年,北美已經出現了至少5家AI安全獨角獸,至少39家AI安全創企獲得新融資,累計融資達8億美元。
“目前AI大模型安全領域還是空白的創業藍海市場。”一位投資人士說。
隨着AI攻擊、AI大模型越獄事件不斷發生,人們對AI失控的風險擔憂日益增加。Haize Labs以AI越獄爲切入口,以AI大模型安全爲抓手,投身入局。
01
三位哈佛應屆生瞄准AI“越獄”
“每個人都對大模型越獄行爲視而不見。”
Leonard Tang在接受媒體採訪時提到,這也成爲了他和兩位朋友Richard Liu、Steve Li一起創辦Haize Labs契機。
據VentureBeat報道,Leonard Tang如今暫停了斯坦福大學博士課程的第一年學業,專注於Haize的發展。Richard Liu、Steve Li則兼顧學業,成爲了伯克利人工智能研究實驗室的本科研究員。
Haize Labs的創始人、CEO Leonard Tang告訴VentureBeat,Haize Labs其實是自己本科階段有關對抗性攻擊和大模型穩健性研究的商業化成果。大學期間,他主修了數學和計算機科學兩大專業課程。
AI直譯,圖源官網
Leonard Tang第一次對LLM(大語言模型)模型越獄產生興趣大約是在兩年前,當時他嘗試通過對圖像分類器進行對抗性攻擊,繞過Twitter的NSFW(Not Safe For Work)過濾器,該工具專門過濾一些不適宜在工作場合查看的內容。
隨後,他發現AI浪潮中似乎每個人都對大模型越獄行爲視而不見,於是受到啓發着手專注AI可靠性和安全性的研究。
今年4月,他在Github上發表了一篇有關《如何輕松越獄Llama3》的論文。論文指出,Llama 3這類大語言模型缺乏自我反省的能力,一旦被誘導,大模型也不知道自己輸出的文字是什么意思。
從其哈佛網站的個人主頁來看,Leonard Tang在大學期間的經歷豐富多彩。除了學業上對LLM模型廣泛研究,他還擁有在多家AI大廠實習的經驗,比如說在英偉達MagLev的ML基礎工程實習生,參與到自動駕駛汽車研究。再比如說,作爲亞馬遜SDE實習生,從事大數據供應鏈物流工作。
另外兩位聯合創始人Richard Liu和Steve Li同樣是AI領域的研究員。Steve Li是哈佛大學計算機科學專業的大四學生,主要專注人工智能安全、語音處理、操作系統和機器學習系統的研究。他曾在Roblox的用戶安全團隊實習,參與到報告功能和 ML分類管道的工作中。
AI直譯,圖源官網
背靠哈佛,衝向硅谷。他們還獲得了一些顧問和天使投資者的支持,建立自己的人脈圈。這其中包括卡內基梅隆大學和哈佛大學的教授、Okta、HuggingFace、Weights and Biases、Replit 的創始人,以及谷歌、Netflix、Stripe、Anduril 等公司的人工智能和安全高管。Graham Neubig等顧問爲Haize Labs 提供 LLM 評估方面的專業知識
業內的AI越獄大神@Pliny the Prompter也是Hazie的朋友和合作方。@Pliny the Prompter以可以迅速攻破Llama 3.1、GPT-4o的安全防线而聞名,他曾表示只需要30分鐘左右的時間,就能破解世界上最強大的人工智能模型。
可以看出,Haize Labs已經在AI大模型安全領域建立了一定初步影響力,並且有了自己的關系網絡,推動相關合作。
02
傳統審查機制不適用AI大模型
最开始,Haize Labs測試了當下許多知名的生成式AI程序、像是AI視頻Pika、ChatGPT、圖像生成器DALL-E等等。他們發現許多知名工具都會產生暴力或色情內容,甚至會指導用戶生產生化武器,並允許自動進行網絡攻擊。
這是因爲傳統審查如基於人工審查、關鍵詞過濾等方法去檢驗大模型輸出內容不精確。
因爲AI大模型通常基於深度學習和大量數據訓練,其決策過程可能不透明,這種“黑箱”特性使得傳統審查難以控制潛在的風險。
同時,AI大模型能夠不斷學習和適應新的數據,其輸出可能隨着時間和輸入的變化而變化。傳統審查機制往往靜態和滯後,難以跟上AI大模型的動態變化。
此外,AI大模型可以處理和分析大量數據,生成內容的速度、新的表達方式和內容,都有可能會遠超於傳統審查機制的預期。
這也導致了無論是OpenAI審查工具Moderation API、谷歌的過濾模型Perspective API,還是Meta的保護模型Llama Guard,性能表現效果都很差。
AI直譯,圖源官網
Hazie對各大AI模型進行越獄測試時,發現Anthropic旗下Claude模型的安全性表現較好,而像Vicuna和Mistral這類沒有明確執行安全微調的模型很容易進行越獄操作。
面對越獄合法性的質疑,Haize Labs表示他們更希望主動出擊,才能提供防御性解決方案,預防此類事件發生。
03
拿下Anthropic、Scale AI 訂單Haize商業化進程迅速
俗語道,不打不相識。
有意思的是,不少曾被攻擊過的機構、模型公司並沒有起訴Haize,反而還成爲了合作夥伴。
如今,Haize Labs的客戶有AI愛好者、政府的附屬機構、模型供應商等。
Haize Labs和AI大模型創企Anthropic達成了3萬美元試點合作、與AI創企AI21籤約了五位數的協議,並且還與AI模型平台Hugging Face、英國人工智能安全研究所(AISI)和 AI工程聯盟MLCommons達成合作。
不僅如此,Haize Labs與Scale AI籤署了50萬美元意向書,目標是對醫療保健和金融領域的LLM進行特定領域的壓力測試,每次更新時都會重新評估模型以保持穩健性。
Haize Labs打造的Haizing套件是一套搜索和優化算法,結合了模糊測試和紅隊測試技術,可以較爲全面的檢查AI系統。該產品主要在开發階段誘導大模型出現幻覺,進行壓力測試,從而更好提醒开發者安全漏洞的問題。
“只有通過嚴格、可擴展且自動地測試您的模型以了解其所有極端情況和弱點,客戶才能开始修復這些弱點。”Leonard Tang說。
Haizing Suite升級了多種算法,使用強化學習等技術檢測有害內容輸入。它利用各種測試場景來發現潛在的問題點,並且通過反向定義不良行爲爲行動指導。
該套件擁有免費版和商業版,其中免費版需要申請,商業版則是Hazie的主要盈利來源。Haizing套件商業版,將爲基礎模型服務商和應用程序層的客戶提供CI/CD haizing和運行時防御解決方案。
AI大模型的巨頭們也注意到AI大模型越獄安全性問題,並先後提醒人們注意。
OpenAI也曾邀請各領域專家通過對抗性方式幫助提高模型的安全性和可靠性,也就是招募“紅隊隊員”
微軟詳細介紹了一種名爲“Skeleton Key”的越獄技術,用戶通過誘導的方式,繞過大模型的安全機制並讓模型認爲,自己輸出的內容是在“合法範圍”之內。
Anthropic則發現隨着窗口長度的不斷增加,大模型的“越獄”現象开始死灰復燃。“現在是時候努力減小大模型越獄的潛在風險了,否則它們可能造成嚴重危害。”Anthropic在公告中說道。
在大模型快速發展的今天,安全一直成爲人們繞不开的話題。
現階段,AI激進派與AI保守派各執一詞,以自己的准繩預測着AI大模型安全的風險值。前不久,馬斯克的AI大模型 Grok 2.0正在以無所限制地生成AI內容,挑战着用戶的敏感神經。AI激進派認爲如果對AI越獄行爲進行全面封鎖,或許會阻礙AI大模型的靈活性和響應能力。
Haize則是通過自動化各種不同類型的攻擊,測試各個AI大模型的安全漏洞,試圖爲AI大模型建立更穩固的防线。
但同時,我們也能看到各大AI大模型廠商已經开始對AI越獄行爲進一步防守。若是Haize的成長僅局限於AI越獄方向,業務方向似乎較爲單一,也難以支撐後續發展。
文末互動:
你看好Haize Labs嗎?
評論區告訴我們你的看法哦~
原文標題 : 三位哈佛00後聯手創業,7個月拿下億元估值
標題:三位哈佛00後聯手創業,7個月拿下億元估值
地址:https://www.utechfun.com/post/417515.html