作者:郝俊慧 來源:IT時報
Bedrock(基巖),地理學中,它是地表層的堅硬巖層,很難被开採;《我的世界》裏,它是最基礎的方塊,不可被破壞;而在2023年世界人工智能大會(WAIC2023)上,它是亞馬遜雲科技帶來的鎮館之寶——基礎大模型雲服務。
今年4月發布的Amazon Bedrock,是亞馬遜雲科技在生成式AI領域的重要布局。之所以稱爲“雲服務”而不僅僅是“大模型”,在於其不僅提供亞馬遜雲科技自己的模型Amazon Titan,還提供初創公司AI21 Labs、Anthropic,以及Stability AI的基礎模型服務的訪問,核心功能在於幫助开發者能夠輕松定制模型,並構建屬於自己的生成式AI應用程序。
不久前召开的WAIC2023上,亞馬遜雲科技生成式AI產品研究院院長Sherry Marcus向中國用戶詳解Amazon Bedrock。
“大模型家族”組團服務
“絕大多數的客戶並不需要自己從零开始來訓練模型。”對於大模型的應用場景,Sherry Marcus开宗明義,認爲不能依賴一個萬能的、單一的大型語言模型來應對各種任務,“正確的做法應該是,客戶可以訪問多個模型,然後根據自己的需求和數據來定制自己的模型。”
當用戶進入Amazon Bedrock官網時,可能只需點擊幾次,便可以找到適合自己的模型服務。
首先是選擇基礎模型。Amazon Bedrock提供了一個“大模型家族”,爲客戶提供已經訓練過的預訓練模型。
其中Amazon Titan系列基礎模型包括Titan Text和Titan Embeddings,Titan Text可以從簡單的自然語言命令生成文本,適用於撰寫博客、電子郵件、文檔摘要、开放式問答和信息提取等各種應用;Titan Embeddings可以爲搜索、異常檢測和個性化等應用程序生成文本嵌入。
當然也可以選擇其他公司預訓練的大模型,AI21 Labs是多語言大語言模型,用於對話問答、工作流自動化,Stable Diffusion更是“文生圖”的頂流,虛擬生成的人像畫質堪比高清相機。
選擇基礎模型之後,便進入微調階段,只要將提示詞發送到模型,由Amazon Bedrock自動部署基礎模型進行推理。
“客戶可以根據自身需求,在大語言模型的基礎之上,進行專業化或者專門化模型的構建,並且使用自己的數據,這樣在享受大模型豐富度的同時,也可以體驗小模型帶來的快速迭代。”Sherry Marcus解釋,通過微調,客戶可以最大限度提高特定任務的准確性,只需使用20個示例標記便可以實現任務准確性,與基礎模型相比,這些定制化模型風格各異,更適合銀行、旅行和醫療等消費場景。
“芯片全家桶”解決算力難題
對於全球雲服務商而言,ChatGPT是一個新的“Game?Changer”(規則制定者),提供以基礎模型雲服務爲主的Maas(大模型即服務)將是雲商下半場主要战術已毋庸置疑。
目前,除了亞馬遜雲科技,國內的華爲雲、騰訊雲等雲商均已提出要爲客戶提供“大模型超市”,而商湯、科大訊飛等擁有強大自主算力的AI公司,也很可能要來分一杯羹。
在這場由AIGC引發的創新浪潮中,算力將是關鍵的勝負手,不僅僅是緊缺的算力資源,還要有高度彈性化的算力供給能力。
WAIC 2023前一周,亞馬遜雲科技中國峰會落幕,彼時亞馬遜雲科技大中華區產品部總經理陳曉建拿出了一張亞馬遜自研芯片“全家福”:作爲亞馬遜雲科技第一款自研芯片,Amazon Nitro實現了高度輕量化的虛擬化,而基於ARM 架構的CPU芯片 Amazon Graviton,可以讓F1一級方程式賽車的开發速度提速70%。
當然,用於機器學習訓練和推理的芯片Amazon Trainium和Amazon Inferentia更受關注。據陳曉建介紹,基於Trainium的Trn1實例(雲計算基礎計算單元)和通用的GPU實例對比,在訓練率上面,單節點可以提升1.2倍,而多節點集群的率可以提升1.5倍,從成本考慮,單節點成本可以降低1.8倍,集群成本更是可降低2.3倍。
針對需要集群訓練的大模型,亞馬遜可以用3萬張Trainium芯片構建一個EC2 UltraCluster超大集群,使用戶可以獲得雲上6 EFlops(每秒100億億次浮點計算)的訓練超算能力。
ChatGPT帶來的英偉達浪潮,使世人目光均聚焦於A100、H100等明星芯片,然而,在實際應用中,推理芯片才是“吞金獸”。原因很簡單,訓練往往只是階段,而推理是7×24在线不中斷的服務,對客戶來說,推理芯片的率、延遲率、成本都很重要。
陳曉建舉例稱,在爲Stable Diffusion 2.1服務時,Inferentia 2可節約50%成本,另一個提供AIGC視頻剪輯的“當紅炸子雞”Runway,通過Inferentia 2獲得了兩倍率的提升。Sherry Marcus透露,通過Trainium和Inferentia,推理性價比提高了40%,數據量增加了四倍。
通過Amazon Bedrock提供基礎大模型服務和以自研芯片確保算力能力,亞馬遜雲科技試圖以低成本和加速的方式,解答更多人對於這場由AI創新帶來的困惑。
“重塑”千行百業
“基礎模型擁有巨大的潛力,但我們仍處在初級階段。”亞馬遜雲科技數據庫、數據分析和機器學習全球副總裁Swami Sivasubramanian此前曾表示,基礎模型多樣化會推動新一波創新浪潮。
盡管這波浪潮只“潮起”了8個月,一頭扎進來的雲服務商、AI服務商和企業客戶卻已初見紅利。亞馬遜雲科技在金融、醫療、外貿、制藥等行業均有合作落地案例。
在醫療和生命科學領域,生成式AI將對制藥、臨牀試驗和醫療實踐等整個價值鏈產生巨大影響,包括設計和合成新蛋白質序列、預測藥物效果和副作用、識別患者風險因素、提供個性化護理方法,甚至合成患者和醫療數據進行模擬研究。
亞馬遜雲科技大中華區機器學習產品總監張洋介紹,飛利浦醫療與亞馬遜雲科技合作,將飛利浦醫學影像系統 Philips HealthSuite Imaging 影像平台的服務部署在雲端,並通過使用基於 Amazon Bedrock 的基礎模型(Foundation Models)加速开發基於雲計算的生成式人工智能應用,提供臨牀決策支持,實現更准確的診斷。在國內,也有醫療客戶已經在利用Stable Diffusion助力生成大分子。
跨境廣告和互聯網廣告中的DSP也已經有類似案例落地。張洋以眼鏡銷售舉例,之前智能制作一個眼鏡廣告,只能上一個眼鏡,或者請拍攝,需要花費大量的時間和精力,還可能涉及到版權,如今利用AIGC進行合成戴眼鏡的,這個模型的推理速度是提升了270%,從原來每分鐘1.5張圖像加速到4張圖像,在有限流量和成本下獲得更多的轉化。
“AIGC將重塑大量客戶體驗和應用程序,”Sherry Marcus認爲,人類當前面臨的最大挑战,正是如何理解AIGC能夠給各行業轉型帶來的影響,“我們可以將眼光放得更遠一點,看它未來會帶來怎樣的顛覆式創新。”
本文作者可以追加內容哦 !
標題:擁有大模型無需從零开始!詳解WAIC2023鎮館之寶Amazon Bedrock
地址:https://www.utechfun.com/post/236682.html