導讀 今年8月,小米AI大模型首次亮相了。與其它公司的千億參數“大模型”不同,小米AI大模型並沒有專注於增加參數量,而是將13億參數的模型下載到用戶的手機本地運行。 小米集團AI實驗室主任、自然語言處理(...
今年8月,小米AI大模型首次亮相了。與其它公司的千億參數“大模型”不同,小米AI大模型並沒有專注於增加參數量,而是將13億參數的模型下載到用戶的手機本地運行。 小米集團AI實驗室主任、自然語言處理(NLP)首席科學家王斌在接受採訪時透露了他們考慮的因素。他說,與其他公司不同,小米擁有大量設備,這些設備的計算能力已經大幅提升。其次,小米是重端側的公司,如果要大量調用雲端算力,成本比較高。此外,用戶隱私、用戶使用手機時的網絡情況等也是他們的考量因素。 不過,過小的參數量也可能影響用戶的使用體驗,因此小米需要在模型規模與硬件門檻之間做好平衡。王斌表示,他們相信除了通用能力,不同維度的小模型可能更適合某一任務,未來可能會以混合體的形式出現,既有雲端,也有端側,既有大模型,也有小模型,通過共通的生態,把用戶體驗做到極致。 據了解,小米從2016年7月起就开始布局AI,今年4月成立了大模型團隊,相關團隊超過了3000人。目前,小愛同學已經开始了AI大模型能力的升級,但並沒有大範圍地开放。
標題:小米AI大模型下載可運行13億參數:考慮隱私因素
地址:https://www.utechfun.com/post/265540.html