Starburst 聯合創始人兼首席執行官 Justin Borgman 概述了他預計的 2025 年數據、人工智能和存儲領域的主要趨勢。
Borgman 強調,企業越來越重視實時分析。“企業將優先考慮實時分析,在幾分鐘內提供洞察,以跟上日益激烈的客戶和市場需求與競爭。這種轉變將使從營銷到客戶服務的各部門能夠更快地做出決策,從而爲組織帶來競爭優勢。實時數據對於希望立即採取行動的公司來說將變得至關重要,將分析從一種臨時的、回顧性的工具轉變爲一種主動的業務驅動因素,”他解釋道。
Borgman 發現的另一個趨勢是,通過定義明確的數據產品加速和擴展人工智能。 “定義明確的數據產品成爲擴展 RAG 等 AI 工作流的先決條件。我們都知道,您的 AI 的好壞取決於您輸入的數據,質量和治理的重要性將變得比以往任何時候都更加重要。此外,數據產品包括業務環境,這對您的 AI 應用程序至關重要,”Borgman 表示。
在討論數據存儲趨勢時,Borgman 指出了混合 Lakehouse 模型的興起。“本地數據架構的復興將使 Lakehouse 擴展到混合環境,無縫融合雲和本地數據存儲。混合 Lakehouse 模型提供了雲存儲的可擴展性和對本地的安全控制,在統一、可訪問的框架內提供靈活性和可擴展性,”Borgman 評論道。
Borgman 還指出,SQL 在數據湖中重新流行起來,這得益於 Apache Iceberg 等簡化數據訪問的表格格式。“由於 Apache Iceberg 等表格格式簡化了數據訪問,SQL 在數據湖中卷土重來,使 SQL 引擎能夠超越 Spark。SQL 的重新流行使整個組織的數據民主化,促進了數據驅動的決策,並擴大了團隊的數據素養。SQL 的可訪問性將使數據洞察廣泛可用,支持數據賦能,”他評論道。
此外,Borgman 建議改變現代數據驅動的 SaaS 應用程序的开發方式,更傾向於使用數據湖而不是傳統數據庫或數據倉庫。
“新的數據應用程序將建立在數據湖上,而不是傳統的數據庫或數據倉庫上,”他說
“原因很簡單:SaaS 公司非常關心他們所提供產品的毛利率,而數據湖的 TCO 明顯更低,並且沒有供應商鎖定。在對象存儲湖上構建應用程序允許公司利用 Iceberg 等开放格式進行存儲,利用 Trino 等开放引擎進行計算。最終結果是應用程序堆棧不會花費太多,而且經過驗證可以處理互聯網規模,”Borgman 詳細闡述道。
標題:未來數據趨勢:實時分析和混合模型
地址:https://www.utechfun.com/post/448942.html