實測4款頭部PPT生成大模型：配圖錯誤頻發、數據可視化集體翻車

2024-08-27 18:40:07 編輯： robot

導讀大模型從圖文、圖片、視頻卷到了PPT生成，但距離“一鍵生成”的終極目標還有明顯距離，這就得看誰能持續“燒錢”完成進步了。 @科技新知原創作者丨余寐編輯丨賽柯 ...

大模型從圖文、圖片、視頻卷到了PPT生成，但距離“一鍵生成”的終極目標還有明顯距離，這就得看誰能持續“燒錢”完成進步了。

@科技新知原創

作者丨余寐編輯丨賽柯

繼聊天機器人、文本創作、圖像生成、視頻生成之後，大模型高調“卷”入PPT生成中。

入局者既包括傳統辦公軟件开發商，如金山辦公推出WPS AI、iSlide推出iSlide AI；也包括互聯網巨頭百度、阿裏等攜百度文庫、誇克AI PPT出場；還有科大訊飛、天工AI、月之暗面Kimi等AI領域的重量級選手。各家紛紛拿出看家本領，爭相在PPT賽道上贏得先機。

比如，國產大模型Kimi聯合AiPPT推出PPT助手，而科大訊飛也不甘示弱，發布了訊飛智文2.0版本的智能文檔AI助理，一鍵生成PPT升級版。這些工具不僅能提煉文檔核心生成大綱，還能一鍵切換主題模板，甚至支持多文檔到PPT的轉換……每一個功能都寫着“省時省力”，每一個營銷點都體現着“卷”的決心。

畢竟“天下苦PPT久矣”，PPT制作一直是職場人士的一大痛點，技術的較量若能推動辦公生產力的革新，用戶自然喜聞樂見。但是，面對如此硬核的用戶真需求，如若企業只是打着AI的幌子交一份僞答卷，無疑將達到反效果，傷了用戶的心。

因此，「科技新知」本次將在國產大模型中挑選四名選手進行實測，包括Kimi、訊飛智文、百度文庫、WPS，以觀察大模型企業對打工人的誠意幾何。

爲確保測評結果的客觀性和參考價值，我們採用以下設定：

1.使用統一的中文提示詞，包括簡易提示詞和復合提示詞；

2.每個大模型的測試項目都包括：輸入主題生成PPT、上傳文檔生成PPT；

3.統一使用電腦網頁版及其默認設置；

4.統一呈現一次生成結果，不進行二次調整優化。

以下是各個模型表現情況：

生成方式1: 輸入主題生成PPT

指令：你是一名經驗豐富的影視產業觀察者，被邀請至高校的課堂做分享，主題是2024年國內五一檔電影及其票房分析，現在需要你據此做一份PPT，要求要有清晰的結構和邏輯，精准的數據支持，精美的視覺設計，須包含圖表，總頁數不超過20頁。

指令說明：作爲一個信息溝通工具，PPT應有效地在繁雜的信息中提煉要點、歸納總結，並將多數據部分做可視化呈現。因此，爲測試這幾款AI PPT的基本能力，本輪測試專門選用具備多主體、多數據主題。

WPS AI：左右滑動查看更多

WPS AI：近900字的PPT大綱，層級分明、內容全面，不禁讓人對這個匯報充滿期待，但最終生成的PPT卻只是把大綱填充進用戶所挑選的模板中，具體內容仍需用戶自行檢索、歸納、分析。

如“背景介紹”部分，WPS AI非常直白地留下一句“分析2024年國內五一檔電影市場，了解電影產業發展趨勢”，相當於只給用戶提供一個思考思路，但相信不少讀者跟「科技新知」一樣，希望AI能完成到分析這一步；對於“影視產業現狀概覽的市場規模”也僅有一句“高度概括”的表述：國內影視產業持續增長，市場規模不斷擴大——水得太明顯了。

Kimi

Kimi：1分鐘的時間裏，Kimi生成了近2000字的大綱，試圖用20頁PPT完成背景介紹、情況簡介、票房數據分析、受衆分析、成敗因素分析、營銷策略分析、政策環境與市場監管、未來市場展望……只能說全面，十分全面。但問題也在於此——主題不突出，未能聚焦“2024年國內五一檔電影及其票房分析”。

和WPS AI一樣，在“一鍵生成PPT”上，Kimi給到的也是一個思路框架、分析模板，如在“2024年票房數據分析”中，Kimi給出的回答是“詳細列出2024年五一檔期間各部影片的票房數據，包括總票房、單日票房、觀影人次等關鍵指標。分析票房數據背後的市場因素，如影片質量、宣傳力度、觀衆口碑等。”不得不承認，這是一個相當完整的分析思路，相較於WPS AI也更爲詳細。

百度文庫：左右滑動查看更多

百度文庫：如圖所示，百度文庫所生成的PPT目錄頁即其大綱的全部，看起來是位惜字如金的選手。意料之外的是，低期待等來了小驚喜，在前三個產品的測試中，百度文庫幾乎是最符合「科技新知」對“一鍵生成PPT”所設想的，包括結構完整、詳略得當、主題突出、能引用官方數據並做分析。

但在生成大綱環節上，百度文庫出現兩段100%重復的內容，由此生成出來的PPT也同樣發生重復。但基於其在內容上的優異表現，這點不足倒也影響不大，只增加了後期手動刪除的步驟。

訊飛智文：左右滑動查看更多

訊飛智文：出現多處排版疊字現象，但瑕不掩瑜，有別於WPS AI和Kimi的籠統和全面，訊飛智文對主題的把握更爲准確，能夠合理分配各部分內容的比例，並能圍繞主題對相關維度做有效分析，如不同影片類型分布及特點、購票渠道與觀影模式、重點城市票房數據等；信息抓取和文本生成能力較爲突出，符合主題且有足夠的豐富度。

生成方式2: 上傳文檔生成PPT

指令：你是一名大學生，要做一個課程期末匯報，文檔名稱爲“電影《傲慢與偏見》人物形象分析匯報”，字數1500，包含電影簡介與創作者簡介、故事梗概、主要角色人物形象分析、人物刻畫手法及小結，請你根據這份匯報講稿生成一份PPT。

指令說明：這項測試是爲根據文檔生成一份匯報演講稿。按一般人平均語速約240字/分鐘計算，整個匯報約6分半。主要評估AI的語言和場景理解能力、文本閱讀能力、概括提煉能力等。

WPS AI：左右滑動查看更多

WPS AI：整體而言，是名簡約派選手，包含封面及尾圖，成品僅6頁。排版合理，但配圖毫無關聯；對文檔內容的處理中規中矩，只做了基於文檔本身的處理，沒有做文檔外的內容補充。

Kimi：左右滑動查看更多

Kimi：盡管上傳的文檔已經是完成的一篇匯報演講稿，但Kimi似乎有自己另外的想法，它基於演講稿的框架和模板做排篇布局，提煉要點，但沒有展开分析，而是提供給用戶思考的方向，更像是一份“半成品”。用戶需再根據其指示自行填充內容。此外，Kimi在本輪表現中竟存在內容與小標題顛倒（混淆？倒置？還是說正文與小標題識別錯誤，位置顛倒之類的會清晰一點？）的低級錯誤。

百度文庫：左右滑動查看更多

百度文庫：根據其提供的選項，我們在“原文一致”和“適當擴寫”中選擇了後者，成稿確實有基於文檔內容補充有效信息和完善，並且擴充內容能夠圍繞“人物形象”這個關鍵詞展开，邏輯合理。排版無太大問題，較爲致命的是配圖出現錯誤，用成《小婦人》的電影截圖。

訊飛智文：左右滑動查看更多

訊飛智文：排版依舊沒有將模板和文字內容進行合理編排，出現多處疊字現象，且PPT頁面字數過多，不僅影響觀感，也不利於觀衆對信息的快速獲取。但通過聯網擴寫，成品能基於演講稿對匯報內容進行有效地完善。此外，其提供的AI配圖是個亮點，雖然圖文相關性還有待加強，但已比前幾家的圖片表現要好。

生成方式3:其余相關維度測評

除整體成稿呈現外，我們還從以下幾個相關維度進行測評：響應速度與效率、使用成本和價格、模板與樣式、用戶體驗與交互、安全與隱私保護。

四款AI大模型PPT生成時間

“一鍵生成”無疑是被PPT硬控的打工人和學生黨夢寐以求的功能。畢竟，一份精美的PPT從挑選模板开始，就要耗費大量的時間和精力。再到梳理結構、確定文本、斟酌用詞、排版布局、設計優化等，可稱爲繁瑣的集合。總體來看，本期測試的四款產品無論是通過輸入主題生成還是上傳文檔生成，成品時間都控制在2.5分鐘內。其背後考驗的是高效的數據管理機制及算法系統等。

看起來，速度與質量有時難兼得。在輸入主題生成中，訊飛智文以整體時間1分鐘的優異成績勝出，且內容質量高。在上傳文檔時，WPS AI僅用了29s，但內容在四家中墊底。

四款AI PPT測評對象對比表

在使用成本方面，AI新秀Kimi出手相當闊綽，目前，其PPT助手功能均可免費使用。其余三家均採用付費會員權益。但在當前拉新階段，三家也都設有免費或低價限時體驗包。

挑模板往往是PPT人艱難的第一步。整體來看，四款產品的PPT模板庫均以教育、職場辦公、科技、商務場景爲主，適用場景及主題還有待進一步豐富。Kimi的大手筆貫穿全程，免費模板量居榜一，而百度文庫多數模板均爲VIP權益，即使是免費模板，生成後下載到本地電腦也需付費。

從樣式上來看，各家生成的PPT在字體、動畫效果和幻燈片切換上都以“基礎款”打底，支持在线編輯或下載後編輯。

WPS AI界面

Kimi界面

百度文檔界面

訊飛智文界面

從交互體驗來看，四款產品注冊登錄方式便捷，均可通過手機驗證碼注冊登錄；支持網頁操作；從界面上看，WPS AI、Kimi和訊飛智能走的是極簡風，用戶能快速找到所需功能，百度文庫頁面則較爲復雜，“AI生成PPT”則位於頁面最右的智能助手，操作界面只有整個首頁的五分之一。

在安全與隱私保護方面，四家均無明顯的隱私政策，未就如何收集、使用和保護用戶數據在顯眼處做相關說明。

測評觀察：技術進步與用戶期待的較量

不得不承認，在對四款AI PPT產品的測評中，我們見證了人工智能在內容創作領域的重要進步。僅需簡單輸入指令、點擊生成，一雙無形的手便以驚人的速度开始編排並“立即生成”，這對於被PPT綁架的用戶無疑是一種解脫。

速度固然重要，但質量才是核心。對話、文本生成是大部分企業切入賽道的第一個發力點，在日復一日的數據訓練中，大模型的自然語言處理能力得到顯著提升，這也爲其往多模態發展打下了堅實的基礎。基於此，在本次測評中，四款產品在邏輯分析上都有相當不錯的表現。

但在文本內容生成上，各家大部分還停留於“提供思路”的層次，在提取有效信息，生成准確且有深度的文本上還有待加強，如WPS AI和Kimi。相比較而言，百度文庫和訊飛智文在本次測試中表現出另一梯隊的水准。如果說WPS AI和Kimi可以一鍵生成一份合格率爲50%的PPT，那百度文庫和訊飛智文基本是80%的水平，這或許也得益於其背後百度、百度文庫和科大訊飛在知識引擎和內容數據上的積累。

欣喜有之，遺憾亦有之。在「科技新知」最期待的數據可視化部分，四名選手則無一例外地選擇“視而不見”。數據——懸在大廠人頭上的“達摩克利斯之劍”，同樣是PPT裏的靈魂擔當，通常包含數據比對，並以圖表、圖形等形式呈現，使其更直觀、易懂。這也是當代打工人做PPT的共識。爲此，在“輸入主題生成”測試中，我們專門挑選了有數據信息的主題，並下達具體指令，要求成稿“須包含圖表”，結果卻沒有看到相應內容的生成。遺漏用戶需求，也反映出對PPT使用痛點和場景理解的不夠深刻。

另一個不容忽視的問題是，PPT常見應用場景既包括學校，也有科研機構、政府及企業等，也意味着大量的數據隱私、商業祕密等。而當前AI PPT大模型產品在數據隱私保護上還顯得標准不足、底氣不足，也都默契地在宣傳營銷層面避而不談。

這么看來，PPT離“一鍵生成”的終極目標還有距離。各路玩家趕路之余，還需繼續練好內功。

大模型綜合能力的提升，很大程度上依賴於海量數據的喂養，其开發與訓練是一項需要全方位資源投入的復雜工程。它不僅依賴頂尖人才團隊和前沿技術，也離不开豐富的高質量語料庫，這要求开發者具備持續的數據採集和處理能力。同時，還需投資大量硬件資源以提供必要的算力資源。

簡而言之，大模型的开發是一場對技術深度、數據廣度和算力強度的綜合考驗，而每一項技術進步的背後都是“燒錢”。

“百模大战”是過去式了，已經到了求生的階段。解鎖新應用場景，是大模型逐步走向商業化的必經之路。據月狐數據測算，2024年6月智能PPT行業用戶規模已達到920萬，行業近3月用戶規模復合增速達21%。面對“PPT”這一需求龐大的內容生成領域，誰又甘心在這場爭奪賽中掉隊？

搶佔剛需的市場，企業務必要拿出實實在在的真本領了。除此之外，針對用戶的培育模式也值得考究，它關乎企業能否長遠地贏得市場與人心。回顧這幾年全球流行的在线辦公軟件發展歷程，從一开始的免費送福利造福上班族，到後來設置使用限制，逐步按功能收費“割韭菜”，引來一片罵聲。至今爲止，關於這些企業的實際產出回報率及用戶留存率的具體數據仍顯匱乏，使得外界難以全面評估其經營成效。

面對你我日益被AI重塑的生活，不管拷問得多細致都不爲過。畢竟每一個爲科技买單的用戶，都還要再付諸時間、隱私及信任。承載着打工人與學生黨厚望的PPT“幫手”，可別把好牌打得稀巴爛。

原文標題 : 實測4款頭部PPT生成大模型：配圖錯誤頻發、數據可視化集體翻車

標題：實測4款頭部PPT生成大模型：配圖錯誤頻發、數據可視化集體翻車

地址：https://www.utechfun.com/post/414963.html

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。

標籤： PPT 大模型訊飛智文

上一篇:綠色統防融合“護航”湖北秋糧豐收

下一篇:多措並舉保障蔬菜市場供應

您現在的位置：首頁人工智能

實測4款頭部PPT生成大模型：配圖錯誤頻發、數據可視化集體翻車

猜你喜歡

您現在的位置： 首頁 人工智能

猜你喜歡

您現在的位置：首頁人工智能