ChatGPT 圖像生成功能迎來升級

在周二的一次直播中,OpenAI 首席執行官山姆・奧特曼宣佈了 ChatGPT 圖像生成能力一年多來的首次重大升級。
ChatGPT 現在可以利用該公司的 GPT - 4o 模型原生地創建和修改圖像及照片。GPT - 4o 長期以來一直是這個人工智能聊天機器人平台的基礎,但在此之前,該模型只能生成和編輯文本,不能生成圖像。
奧特曼表示,對於 OpenAI 每月 200 美元的專業版計劃訂閱者來說,GPT - 4o 原生圖像生成功能現已在 ChatGPT 和 OpenAI 的人工智能視頻生成產品 Sora 中上線。OpenAI 稱,該功能很快將向 ChatGPT 的 Plus 用戶和免費用戶以及使用該公司應用程序編程接口(API)服務的開發者推出。

與它實際上取代的圖像生成模型 DALL - E 3 相比,具有圖像輸出功能的 GPT - 4o 「思考」 的時間要長一些,以生成 OpenAI 所說的更準確、更詳細的圖像。GPT - 4o 可以編輯現有的圖像,包括有人物的圖像 —— 對其進行變換或 「修復」 前景和背景物體等細節。
為了支持新的圖像功能,OpenAI 稱,它使用 「公開可用的數據」 以及與 Shutterstock 等公司合作獲得的專有數據來訓練 GPT - 4o。
許多生成式人工智能供應商將訓練數據視為一種競爭優勢,因此他們對其及相關信息守口如瓶。但訓練數據的細節也是潛在的知識產權相關訴訟的來源,這是公司不願透露太多的另一個原因。
OpenAI 首席運營官布拉德・萊特卡普在一份聲明中表示:「在輸出方面,我們尊重藝術家的權利,並且我們有相應的政策來防止我們生成直接模仿任何在世藝術家作品的圖像。」
OpenAI 提供了一個退出表單,創作者可以通過該表單請求將他們的作品從其訓練數據集中刪除。該公司還表示,它會尊重禁止其網絡爬蟲從網站收集包括圖像在內的訓練數據的請求。
ChatGPT 升級後的圖像生成功能是在谷歌為其旗艦模型之一 Gemini 2.0 Flash 推出實驗性原生圖像輸出功能之後推出的。這個強大的功能在社交媒體上迅速傳播,但不一定是因為好的原因。事實證明,Gemini 2.0 Flash 的圖像組件幾乎沒有防護措施,這使得人們可以去除水印並創建描繪受版權保護角色的圖像。
責任編輯:丁文武