讓AI寫代碼正在越來越流行。今天螞蟻集團智能研發平台CodeFuse推出了“圖生代碼”技術,這一技術集成在CodeFuse上,可將網頁、App等設計圖一鍵轉化成前端代碼。不只是螞蟻,阿裏雲、百度、360、OpenAI、微軟、GitHub、Google等科技巨頭均在持續加碼代碼大模型,探索AI“自編程”。
看似高度專業且極具創造性的編程儼然已成大模型落地的核心領域之一,這聽着就好像“機器人制造機器人”一樣酷。既然如此,“編程”本身將會被AI如何改變呢?
巨頭狂卷代碼大模型,
自然語言編程是終極目標
互聯網時代,包括比爾蓋茨、喬布斯在內的大佬都曾鼓勵人人都要學會編程,特別是兒童。然而前段時間,AI大佬、英偉達CEO黃仁勳卻在對孩子的寄語中稱,“生成式AI的發展大幅降低了學習編程的重要性。”而英偉達的工作,“就是創造計算技術,讓所有人都不需要編程。”
不過黃仁勳並沒有否定編程本身的價值,只是他認爲AI可以讓每個人都能編程:“編程語言可以普及成爲人類的語言,現在世界上每個人都是程序員。這就是人工智能的奇跡。”
有了計算機就有了編程的概念。編程語言一直在進化,從最初的二進制,到後來的機器代碼,到匯編語言,再到高級語言。這些年,高級語言也在不斷革新。而編程語言不斷進階的目的,就是爲了讓編程難度更低、效率更高。按照這樣的路线來看,人人都掌握的自然語言將是“編程語言”進化的終極形態。
(常見編程語言)
不過,這就跟無人駕駛一樣:L5自動駕駛終究只是理想,當下智能汽車上商用的卻都是L3級輔助駕駛。短期內,“完全自然語言編程”不可能成爲現實。但隨着AI大模型的發展,AI在編程以及研發中正在發揮日益重要的作用,科技巨頭無不在战略布局,實現更加自動化的研發模式。
2020年,OpenAI推出了擁有1.75萬億參數、取得重大突破的GPT-3。21年,OpenAI基於GPT-3模型开發了成功破圈的ChatGPT,與此同時也創建了Codex系統,其可根據程序員的自然語言輸入進行簡單的代碼編寫支持,這是AI編程的起點。
Codex的出現,讓IT研發界大爲震撼:AI可將程序員從重復、繁重、繁瑣以及機械的編程工作中解放出來,讓他們專注於創造產品本身。正因爲此,在AI與研發軟件領域均有建樹的巨頭,如Google、微軟、阿裏雲、螞蟻、百度、360、華爲均競相研發並推出代碼大模型。
微軟推出了OpenAI Dall-E驅動的圖片設計工具,在低代碼應用开發軟件Power Apps中推出了支持GPT-3的工具,並根據OpenAI的Codex模型开發了一款代碼建議工具GitHub Copilot。
(OpenAI CodeX)
Google在推出PaLM Coder代碼大模型的同時,於23年與新晉AI編程獨角獸 Replit合作,將其人工智能語言模型和Replit的生成式代碼工具Ghostwriter結合。
Replit由Facebook前軟件工程師Amjad Masad創辦,在打造全球最大的在线IDE(集成开發環境)後,於2022年11月基於AI大模型技術推出Ghostwriter,對標 GitHub Copilot,擁有代碼自動生成和補全、進行代碼語言轉換、支持代碼解釋和搜索等。
中國科技巨頭不遑多讓。2022年華爲推出代碼大模型Pangu-Coder;23年百度智能雲推出“Comate”代碼助手,第一階段的主要功能是“輔助代碼撰寫”,此後將在特定領域場景實現自然語言代碼生成,第三階段將實現全領域的自然語言开發;同一年,螞蟻“百靈大模型家族”迎來了代碼大模型成員CodeFuse,其源自於螞蟻?身的开發場景及代碼庫沉澱,基於海量?質量代碼數據和代碼領域特?詞表,和多任務微調技術MFT,在螞蟻?萬多內部研發?員的?常編碼、測試、運維等場景中,經過反復驗證與迭代。去年中,CodeFuse 及其必要的?具鏈,?向技術社區开源开放;10月,CodeFuse推出IDE插件功能,支持多種語言和編程工具。
(螞蟻CodeFuse)
24年,代碼大模型呈現出百花齊放的態勢。在螞蟻CodeFuse推出“圖生代碼”的同一時期,阿裏雲迎來了1號AI員工“通義靈碼”的上线,其“簡歷”顯示這是一個出生於0101世界、無性別的硅基生命,人格屬於INTJ,職位是AI智能編碼助手,項目經歷是“截至2023年4月,下載量超過200萬,每天數百萬行代碼被程序員採用。”在4月中旬即將召开的百度Create2024大會上,李彥宏也將發布AI編程相關產品更新。
巨頭狂卷大模型,而代碼大模型更是成了兵家必爭之地。
跟一日千裏的GPT一樣,21年到現在代碼大模型正在快速升級。在AI編程上,從最初的行級代碼補全,升級到倉庫級代碼生成,再進化到自然語言描述下的代碼生成。在代碼生成外,演進出代碼語言轉換、代碼解釋和搜索、軟件文檔撰寫、智能編程助理等功能,甚至出現了螞蟻提出的“AI賦能全生命周期研發”這樣的新的研發範式。
AI編程讓程序員專注於創造,
助力企業研發降本增效
編程AI化是計算進化的必然。在通用計算體系下,摩爾定律早已失效。但讓人始料未及的是,“摩爾定律”卻在AI計算體系中得以延續。Open AI CEO、ChatGPT之父Sam Altman指出,每年LLM參數規模大小增長10X,人工智能運算量每隔18個月翻一番,這被稱爲“AI摩爾定律”。在AI軟件內涵突變之時,低效的傳統研發模式難以爲繼,研發模式的奇點也已到來。
(AI摩爾定律)
AI如何改變研發本身成爲業界關注的新焦點。紅杉資本則認爲,生成式AI將逐漸改變各個行業,但軟件开發模式的轉型還沒完成。紅杉提出了“开發工具2.0”,指出這種“Beyond Copilot”的新形態,尚未被定義。
AI大模型率先改變的都是創造性職業,比如文字、圖片、視頻、音樂等內容的創作均迎來了各自的現象級應用:ChatGPT、Midjourney、Sora、Suno。如今,AI對創造的賦能來到了編程領域,AI編程將是AI大模型技術的下一個“殺手鐗場景”。
對科技巨頭來說,布局AI編程,既是內在研發提效的剛需,也是布局新興業務的必要——這跟雲計算、to B數字科技“始於內、發於外”的歷程一致。
首先,通用大模型要落地離不开“垂直大模型”這一橋梁,而編程則是大模型最有潛力的垂直應用場景,大模型與軟件开發工具結合可顯著解決技術人員面臨的痛點。
最早大規模引入AI編程的GitHub平台曾在一篇調研文章中探討了GitHub Copilot對程序員效率和幸福感的提升,發現使用工具的程序員完成任務速度快55%,96%的使用者認爲自己處理重復性的工作更快了,88%的使用者認爲自己可以更加專注於更喜歡的工作上。
百度、阿裏雲、螞蟻等布局代碼大模型的國內巨頭,也是先嘗到了甜頭。比如在螞蟻內部,CodeFuse ?持40多種編程語?,10多個主流IDE平台,現在有超過五成的程序員使用CodeFuse,在這些程序員寫的代碼裏,AI生成代碼佔比超過了10%,整體採納率30%,在生成單元測試場景採納率可達到 60%。以最新發布的“圖生代碼”技術爲例,前端工程師在還原一個中型網頁時,如果最終有200 行代碼,一人耗時約需1小時,使用CodeFuse一鍵生成後,只需檢查與調整,這大幅提高了前端工程師的效率。
(CodeFuse正在成爲越來越多程序員的編程工具)
其次,編程人員群體龐大,研發提效是科技巨頭高質量增長的關鍵一環。
以中國爲例,來自Boss直聘的《2023年中國程序員人才發展報告》顯示,中國程序員總數約爲600萬人左右。如果算上需求分析師、設計師、UI/UE/UX、產品經理、IT運維等研發上下遊工種,IT研發人才群體更加龐大。
大量的研發人才意味着龐大的研發支出,這從頭部互聯網企業的研發成本可以窺見,李彥宏日前表示,百度這么多年研發費用佔到收入的比重一直是20%以上,以23年1345.98億元營收計算,研發投入在270億左右。阿裏、騰訊、字節、華爲等巨頭的研發投入規模更大,且相當部分均在軟件研發上。
哪怕代碼大模型可提高1%的研發效率(當然,從實踐來看提效遠不止1%),對科技巨頭降本增效也有非凡意義——高質量增長是科技行業的主旋律,降本增效是每家公司的重點。正因爲此,所有科技企業都將推動所有軟件工程師使用AI編程工具。
最後,程序員以及研發人員具有更強的“AI基礎素養”,更樂意利用、更可能用好AI編程輔助工具。
對於非技術類人員來說,即便是使用ChatGPT這樣的大衆化工具,也需要學習“Prompt(提示詞)”等技能,可見真正使用AI大模型來創作對大多數人來說是有門檻的,且普通人無法適應當前大模型技術結果的不確定性、不可靠。
對技術人才來說,以上問題不存在,因爲他們是最善於使用工具、也樂於探索新工具的人群。程序員是“終身學習職業”職業,他們一直在學習更先進的編程語言、尋覓更先進的工具、應用最先進的方法來提高工作效率與質量。在代碼大模型驅動下,AI編程工具如雨後春筍出現,對應的研發體系、協作流程、管理方法、設計模式都將劇變,就算企業不推動,研發人員也會自主去探索和學習AI研發工具。
(CodeFuse IDE插件的代碼生成功能(部分))
Gartner發布的2024年十大战略技術趨勢也指出:到2028年,75%的企業軟件工程師將使用AI編程助手。放眼未來,在助力企業研發板塊“降本增效”的同時,代碼大模型將更大程度地解放技術人員,讓他們專注於更高維度的創造工作。
AI編程進階:
從協助寫代碼到重構研發範式
從當前的AI編程實踐來看,代碼大模型正沿着兩個方向演進。
一條路是不斷提高代碼生成能力,做好程序員編程智能輔助工具。代碼生成、補全、解釋與轉換能力,從行級到片段到倉庫級不斷進化。在生成代碼時,支持多輪對話式需求理解,支持自然語言、語音、圖生代碼等多模態指令理解,這也是包括GitHub Copilot在內的AI編程平台在主攻的方向,它們基於雲提供SaaS服務或插件工具,着重於助力程序員提高代碼編寫的效率和質量。
另一條路則是讓AI滲透到研發的全生命周期,重構研發體系。
軟件开發涉及到需求分析、編程开發、測試與構建、發布與運維、數據洞察等鏈路。每一個鏈路都需要使用大量的專業工具,且與上下遊研發鏈路進行協作。理論上來說,所有研發工具都可以被AI重做一遍,軟件研發範式(包括工具鏈、協作流程、項目管理方法、設計模式等等)都將被重構。
在國內,螞蟻CodeFuse 是AI全?命周期研發的首倡者和積極探索者。在內部,螞蟻已將?模型技術應?在研發的全鏈路環節,在CodeFuse的版圖中,在需求階段,Project Copilot提供多場景开發助手,提供需求/設計文檔智能生成等服務;在开發、測試、運維和數據環節,分別提供Code Copilot(IDE插件)、Test Copilot、Ops Copilot、Data Copilot等AI研發工具,大幅提高對應環節研發人員的工作效率。CodeFuse 在螞蟻內部被大規模應用在工業化生產場景,經過反復驗證與迭代後再以开發助手、IDE插件、AI Native IDE、Open API、开源等形式开放給行業,同時也針對小程序开發等特殊場景定制了AIGC方案。
(螞蟻CodeFuse探索AI全?命周期研發範式)
第二種路线可被簡單地理解成企業研發的數智化升級,這將是科技類企業數智能升級中不容忽視的一環。自動駕駛技術不只是改變了車輛駕駛方式,也將重構出行、物流、道路、交管、法規等交通體系。同理,AI大模型不只是會提升程序員個體的工作效率,也將締造全新的研發範式。大部分的AI編程工具強調通用性,不大可能面向前端工程師提供“圖生代碼”這樣的細化服務,因此目前更多是影響個人开發者。但在AI大模型重構研發體系時,开發團隊更需要去做全生命周期的AI研發的頂層布局,在每一個鏈路中使用AI研發工具且採取全新的協作模式、管理方法。
AI研發勢不可擋,
IT技術人員何去何從?
回到开篇的問題:編程到底會不會消亡?
看上去,隨着AI編程技術的發展,人人都可用自然語言來編程,程序員確實將成爲不復存在的職業。
但事實並非如此。
一方面,程序員的核心價值是“創造”,創造本身不可能被機器取代。自然語言編程只是降低了編程的“交互門檻”,但編程的根本是抽象思維、邏輯思維、系統思維、算法思維以及創造思維,特別是對物理世界的認知、理解與抽象,這些並非AI所長。
另一方面,產品研發不只是編程。正如前文所言,研發涉及到需求分析等等環節,同時需要與產品運營、市場推廣、商業化等環節密切配合,這些更是AI不可能做好的事情,比如AI就不可能洞察到用戶有在手機上收發紅包這樣的細微需求,更不可能做出網絡紅包這樣的創新產品——當然,有了AI編程工具,網絡紅包的开發會更敏捷,更高效。螞蟻“2024支付寶五福節”的遊戲中心項目代碼,就有30%由AI提交。
受過軟件开發專業訓練的人都知道,編程不等於寫代碼,項目管理、軟件測試、需求分析、算法、數據結構等等全鏈路研發技能也是所有計算機軟件類專業的必修課。正因爲此,技術人員要盡可能地用好AI編程工具提升個體工作效率,同時增強復合型能力,當重復性等工作大幅減少可用更多時間“創造”,強化用戶需求分析、創意設計、業務理解、項目管理等能力。
正如螞蟻集團CodeFuse負責人所言:“AI的普及不僅可以減少开發人員的工作壓力,讓他們有更多精力投入到更有創造力的工作中去。”而AI研發範式的變革,並不代表“人”在研發場景的角色會消失,反而對AI和人如何協同提出了更高的要求。“AI目前主要集中在輔助編程(code copilot),編程要從copilot走向co-worker,甚至替代人,還有很多未解決的問題,而整個研發生命周期的AI自動化,還有很長的路要走。”
AI不會取代任何舊的職業,但會淘汰思維陳舊的人。長期來看,AI將成爲人類的助手,?機協同是AI發展的終局,這一點會在研發特別是編程場景率先體現。對於企業來說,研發是根基,其本質是用技術解決問題和創造產品,這將是硅基文明基礎生產方式。2024年的一個顯著趨勢是,編程以及研發本身,正在被AI大模型技術重構。所有技術人員必須擁抱AI研發的全新理念,適應新的研發協作模式。
是時候重新出發了。
原文標題 : 巨頭狂卷代碼大模型
標題:巨頭狂卷代碼大模型
地址:https://www.utechfun.com/post/357362.html