AI 產業本週由 OpenAI 新推出 GPT-4o,為多模態模型深入人們日常應用搶頭香。
新模型 GPT-4o 可接受文字、圖像、音訊的任意輸入組合,即時產生文字、音訊、圖像的任意輸出組合,大大改善 ChatGPT 體驗,尤其與 ChatGPT 互動更像真人交談,帶有屬於人類的情緒和口氣,有時保有耐性,偶而展現俏皮的一面,呈現更自然的人機互動。
從 OpenAI 公布多個使用案例,以及開發者或一般網友初步測試下,支援 GPT-4o 的 ChatGPT 性能令人驚豔:
1. 透過手機鏡頭和 ChatGPT,彷彿讓視障朋友也能看見這個世界。
2. 兩個 ChatGPT 互相交談,透過手機鏡頭分享看到的人事物。
3. 線上教育平台可汗學院(Khan Academy)創辦人 Sal Khan 及兒子 Imran Khan 參與測試,ChatGPT 讀取螢幕顯示的數學題目下,教 Imran Khan 一步步解出正弦 sin(α)。
4. 利用 Mac 版 ChatGPT App,ChatGPT 也能參與視訊會議,提出想法一同討論,最後摘要重點。
5. 面試前,有 ChatGPT 一起做準備,它可給予一些建議。
6. ChatGPT 在發表會現場化身口譯員,流利地翻譯義大利語和英語。
7. 透過 Mac 版 ChatGPT App 和純粹 Breakout 遊戲截圖,就能讓 ChatGPT 生成遊戲程式碼。
The new ChatGPT Mac app is amazing.
I got a fully working Breakout game code using a shortcut to pull up the app with GPT-4o and a simple screenshot of my screen.
So many use cases and faster workflows.
— Alvaro Cintas (@dr_cintas)
8. 手機用 CahtGPT,20 秒就能建立 3D 模型的 STL 檔案。
I used GPT-4o to create STL file for 3D model in ~ 20 seconds on my phone.
Pretty remarkable what you can generate with AI and simple prompt now.
— Min Choi (@minchoi)
9. 透過手機鏡頭和 ChatGPT,辨識紙上書寫體文字,雖然有少數幾個字辨識錯誤,體驗仍出色。
GPT-4o is truly remarkable on 18th handwriting. I gave it the following letter and asked it for a transcription. A couple of very minor errors…amazing!
— Generative History (@HistoryGPT)
10. 支援 GPT-4o 的 ChatGPT 解讀表情的能力更細緻,已達到人類水準。
The ability of GPT-4o to interpret faces is at human level.
— Flowers from the future (@futuristflower)
(首圖來源:截圖)
延伸閱讀:
標題:十個印象深刻的 GPT-4o 使用案例,ChatGPT 化身數學家教、口譯員
地址:https://www.utechfun.com/post/372275.html