作者:王昕 來源:IT時報
近日,明略科技集團實現了機器學習可視化工具——TensorBoard的C++接口,進一步豐富了基於C++的大模型項目工具集,使得大模型預訓練過程監控更加便捷、高效,加速營銷領域大模型預訓練進程。該工具已在Github开源。
TensorBoard是Google开發的一款機器學習可視化工具,常用於監測機器學習過程的各項指標。明略科技高級技術總監趙亮介紹:“在大模型訓練過程中,數據監測是一個重要維度,而TensorBoard通過可視化模型中的各種參數和結果,例如記錄大模型訓練過程的Loss變化、驗證集的PPL變化、學習率變化、Token消耗量、單步參數更新時延等指標,幫助分析訓練狀態,發現訓練過程中出現的問題並及時採取幹預措施,提升大模型訓練進程和效果。”
明略科技开源的C++接口TensorBoard工具頁面
此前,TensorBoard僅支持Python語言接口。此次明略科技通過C++實現TensorBoard,將進一步豐富基於C++實現的大模型項目工具集,大幅提升模型訓練監測效率,加速模型訓練進程,改寫接口後的工具將通過多維度的數據模式展示訓練指標,包括標量、直方圖、圖像、圖像合集、音頻、文本等數據模式。該工具包通過github項目Tensorboard.cpp分享,助力更多研究者和开發者參與並加速大模型的研發進程,推動人工智能多領域的應用探索。
明略科技集團CTO郝傑表示:“我們要在更高效、更低成本的要求下做出營銷領域的大模型,通過自適應技術提升大模型的能力。好的行業大模型需要具備通用大模型的邏輯性、語言順暢度,同時還需要實現通用大模型所不具備的,在某個行業內或具體的領域中的真實性、專業性。”
本文作者可以追加內容哦 !
標題:新增C++大模型工具集 明略科技开源TensorBoard.cpp
地址:https://www.utechfun.com/post/248333.html