人工智能(AI)已經無處不在,給衆多行業帶來了革命性的變革。
無處不在的人工智能是我們正在迅速進入的一個時代,在這個時代,終端用戶越來越習慣於大規模的個性化,否則他們將轉向商業競爭對手提供的產品,這些競爭對手可能正在使用人工智能來創建定制服務和用戶體驗。
第五代英特爾至強可擴展處理器於2023年12月14日發布,這是在人工智能領域快速發展的時代宣布的,特別是由於商業和公衆對生成式人工智能等模型的興趣在公共終端用戶和商業社區都積累了許多用戶。
OpenAI的ChatGPT風靡全球,在短短2個月內就積累了1億用戶。來自Meta(Instagram)的线程獲得1億用戶的速度更快,然而,這張圖表說明了用戶採用生成式人工智能的速度有多快。
讓我們回顧一下這段歷程,下面列出了一些關鍵的人工智能類型:
生成式人工智能的興起
目前人工智能領域的許多令人興奮之處都是由生成式人工智能驅動的,特別是那些與深度強化學習相結合的模型。這使終端用戶和企業能夠創建內容,也使企業能夠开發更好的最先進的虛擬代理,包括聊天機器人。然而,此類模型的計算成本也很高,導致高能耗,因此也產生了有意義的碳足跡。
如果我們能夠找到有效擴展生成式人工智能的方法,那么就會帶來切實的經濟效益。例如,將生成式人工智能應用於客戶服務相關功能可能會導致生產力提高,範圍爲現有功能成本的30%至45%,並且與研發相關的生產力可提高總成本的10%至15%。此外,同一份報告還估計,生成式人工智能可能會提高營銷職能的生產力,其價值佔總營銷支出的5%至15%。
生成式人工智能可以幫助企業進行情感分析、文檔分析和摘要以及文本到圖像的創建。下一節將舉例說明人工智能如何改變不同經濟部門。
醫療保健:醫學成像、遠程監控、用於分析電子健康記錄(EHR)的自然語言、新藥物發現和個性化藥物交付;
教育:私人導師提供定制的教育支持,以滿足學生的個性化需求;
營銷:用於個性化內容創建的生成式人工智能,針對那些更有可能對產品或服務感興趣的人定制內容,以及個性化優惠和推薦;
交通:自動駕駛車輛導航、車輛健康檢查和監控;
建築:用於設計和數字孿生的生成式人工智能;
安全:入侵者檢測、預測分析、人群控制警告;
網絡安全:惡意軟件威脅檢測和防護;
制造:預測分析,包括計劃外停機檢測、自動缺陷零件分析;
金融服務與投資:自動化信用分析、股票研究、ESG分類、投資組合構建、風險管理、要素投資、保險自動理賠管理、承保風險評估和定價的金融科技解決方案;
客戶關系管理(CRM)和客戶體驗(CX):用於客戶參與的聊天機器人
能源:用於檢查太陽能電池板和風力渦輪機葉片缺陷的計算機視覺無人機、天氣預報、可再生能源生產預測、能源需求預測、電池存儲優化、智能電網;
智慧城市:城市交通規劃、智慧建築、優化能源消耗;
零售:個性化推薦、庫存管理、產品需求預測、供應鏈優化;
會計:經過微調的LLM可以閱讀和分析特定的文檔和電子表格,並協助开發票文檔。
法律部門:用於研究協助、案件管理、發票管理、合同起草的自然語言。
英特爾第5代thGenXeon可擴展處理器實現AI的高效擴展
大量的延遲會破壞客戶體驗(CX),而高計算資源可能只會導致生成式AI模型成本過高而無法大規模採用。延遲是指客戶端設備所需的時間以及從服務器發回信號所需的時間設備,通常是數據和分析所在的基於雲的遠程服務器。這可能會導致糟糕且令人不滿意的用戶體驗,甚至可能導致客戶端需要響應才能做出關鍵決策的潛在危險情況。
最新一代的英特爾至強可擴展處理器可以解決這個問題,並幫助企業和公衆更有效地採用由LLM支持的生成式人工智能模型。
以下是英特爾與第五代至強可擴展處理器和AIEverywhere相關的示例:
英特爾矩陣擴展(英特爾AMX)第五代可擴展處理器使生成式AI在CPU上更容易訪問,允許用戶在需要訪問加速器之前執行更多操作。
憑借每個內核中的AI加速功能,第五代英特爾®至強®處理器已准備好處理苛刻的AI工作負載,包括在需要添加離散加速器之前,對多達200億個參數的模型進行推理和微調。
SLA(服務等級協議)可在200億個參數下的LLM上實現實時用戶體驗,令牌(生成動態口令的終端)延遲低於100毫秒。
具體的性能增強包括:與第四代英特爾至強處理器相比,GPT-J的平均第一次令牌加速高達13%,平均第二次令牌加速高達22%。
相對於第三代英特爾處理器,GPT-J的平均第一令牌加速高達2.3倍,平均第二令牌加速高達64%。
第一個令牌延遲加速高達12%
與第三代Intel至強處理器相比,LLaMA-213B上的第一個令牌延遲加速高達2.1倍,第二個令牌延遲加速高達48%。
實時推薦
第五代英特爾至強可擴展處理器提供快速,個性化的產品或內容推薦,不會減慢用戶體驗,基於深度學習的推薦系統考慮實時用戶行爲信號和上下文特徵,如時間和地點。第五代英特爾®至強®可擴展處理器採用英特爾®高級矩陣擴展(英特爾®AMX),這是一種內置加速器,可加速深度學習推理並加速CPU上的小型模型訓練。性能改進包括:
● 與第四代AMDEPYC(霄龍處理器)相比,DLRM(INT8)的批量推理性能提高了2.34倍。
● 與第四代英特爾至強處理器相比,DLRM(模型)的批量推理性能提高了24%。
自然語言處理
更流暢的體驗和更快的響應
通過自然語言處理(NLP)推理的性能飛躍,實現響應速度更快的智能助手、聊天機器人、預測文本、語言翻譯等。
● 與採用FP32的第三代英特爾至強處理器相比,BERT-Large(大規模語言模型)的實時推理性能提高了9.9倍。
● 與採用FP32的第三代英特爾至強處理器相比,DistilBERT(大型語言模型)的實時推理性能提高了7倍。
隨着英特爾®oneAPI深度神經網絡庫(oneDNN)軟件優化已經集成到TensorFlow(符號數學系統)和PyTorch(开源的Python機器學習庫)的主流發行版中,开發人員可以更輕松地訪問內置AI加速的好處。英特爾®軟件开發工具使开發人員可以自由地在不同的硬件架構和供應商之間遷移代碼,具有相當的性能,提高了生產力和未來的准備能力,而不會帶來昂貴和耗時的挑战。
對於更密集的AI需求,請添加專用的英特爾®Gaudi®AI加速器來擴展基於CPU的基礎。
● 與第四代處理器相比,最高可達1.19倍(BF16)和1.23倍(INT8);與第三代英特爾®至強®處理器相比,最高可達9.9倍(BF16)和9.2倍(INT8)。
● 與第四代處理器相比,最高可達1.41倍(BF16)和1.35倍(INT8);與第三代英特爾®至強®處理器相比,最高可達7倍(BF16)和2.9倍(INT8)。
借助已集成到TensorFlow和PyTorch主流發行版中的英特爾®oneAPI深度神經網絡庫(oneDNN)軟件優化,开發人員可以獲得內置AI加速的優勢。
● 與AMDEPYC9654相比高達2.34倍,與AMDEYPC9754相比高達1.9倍。
● 與第四代處理器相比,最高可達1.24倍(BF16)和1.24倍(INT8);與第三代英特爾®至強®處理器相比,最高可達8.7倍(BF16)和5.5倍(INT8)。
機器學習
第五代英特爾至強可擴展處理器可在CPU上實現高速機器學習。
經典機器學習在高性能計算(HPC)和人工智能應用中發揮着至關重要的作用,從生命科學到金融再到學術研究。憑借大內存、快速內核和英特爾®高級矢量擴展512(英特爾®AVX-512),第五代英特爾®至強®可擴展處理器可提供出色的機器學習訓練和推理性能。
借助英特爾®AI軟件產品組合,开發人員可以加速端到端機器學習和數據科學管道。這些工具包括優化的框架、模型存儲庫、用於Scikit-learn的英特爾®擴展和用於機器學習的英特爾®XGBoost優化、通過英特爾®Modin分發的加速數據分析、優化的核心Python庫以及端到端工作負載的示例。
此外,英特爾聲稱,與NVIDIA相比,第五代至強可擴展處理器爲整個AI管道提供了更廣泛的範圍,用戶可以:
從數據預處理到推理,使用比NVIDIA gpu更擅長於更廣泛的AI任務的Intel®Xeon®處理器導航整個AI任務。
只需幾分鐘即可在CPU上訓練中小型深度學習模型。借助英特爾®高級矩陣擴展(英特爾®AMX),用戶可以獲得內置矩陣乘法引擎,該引擎可提供離散加速器性能,而無需增加GPU的硬件和復雜性。
值得注意的是,當今大多數數據中心人工智能推理部署都在指示信任級別的英特爾®至強®處理器上運行。
此外,英特爾還聲稱,憑借大內存、快速內核和英特爾®高級矢量擴展512(英特爾®AVX-512),英特爾至強處理器可提供比NVIDIAGPU更好的機器學習訓練和推理性能。
此外,預計邊緣,特別是物聯網將在2024年繼續增長和規模化,因此支持在設備上進行AI決策的硬件資源將成爲關鍵。不過,值得注意的是,英特爾第5th代Xeon可擴展處理器通過英特爾高級矩陣可將實時圖像分類推理提高高達24%解決方案。
總而言之,第五代英特爾至強可擴展處理器爲企業和終端用戶,提供了充分利用和擴展生成式人工智能和人工智能模型的巨大潛力的潛力,相對於上一代英特爾至強處理器,性能顯著提高。
標題:人工智能興起 未來人工智能將無處不在|觀點
地址:https://www.utechfun.com/post/308486.html