Google Cloud 打造第二代文字轉圖像 AI 工具 Imagen 2,其 AI 模型可以根據文字提示建立和編輯圖像。
Imagen 2 利用 Google DeepMind 技術開發而成,該模型在 5 月 Google I/O 2023 開發者大會悄悄推出預覽版,現在正式提供給列入許可名單的 Vertex AI 用戶使用,Vertex AI 是用於建構模型和 AI 應用程式的開發者工具。與第一代 相比,Google Cloud 聲稱 Imagen 2 在圖像品質顯著提升,並能準確描繪出提示需求。
Imagen 2 與其他圖像生成模型如 、 等大致相同,但有兩點差異在於,Imagen 2 不僅可以讀取英文提示,更直接支援中文、印地語、日語、韓語、葡萄牙語、西班牙語其他六種語言,明年也會支援更多語言,還能產生創意且逼真的標誌並覆蓋在現有圖像上。
「由於新穎訓練和建模技術,Imagen 2 可以理解更具描述性的長篇提示,並對有關圖像細節提供詳細答案」,Google Cloud 表示這些技術也強化 Imagen 2 多語言理解能力。
Imagen 2 利用 Google DeepMind 開發的 ,將隱形浮水印加入模型產生的影像上,並能適應壓縮、色彩調整、套用濾鏡等圖像編輯。偵測隱形浮水印需要 Google 的工具,第三方無法使用該工具。
Google Cloud 未透露使用哪些資料訓練 Imagen 2 模型,這點不令人意外。像 Google 這種開發生成式 AI 的科技公司是否可以利用公開資料(甚至是受版權保護的資料)訓練模型、從事商業活動,目前仍是一個懸而未決的法律問題。Google 則為用戶提出賠償辦法,保護符合條件的 Vertex AI 用戶免受與 Google 使用訓練資料和 Imagen 2 輸出的版權索賠。
(首圖為 Imagen 2 生成範例,首圖來源:)
延伸閱讀:
標題:Google 文字轉圖像模型升級第二代,支援英文、中文等七種語言
地址:https://www.utechfun.com/post/303468.html