ChatGPT 图像生成功能迎来升级

　　ChatGPT 图像生成功能迎来升级

　　在周二的一次直播中，OpenAI 首席执行官山姆・奥特曼宣布了 ChatGPT 图像生成能力一年多来的首次重大升级。

　　ChatGPT 现在可以利用该公司的 GPT - 4o 模型原生地创建和修改图像及照片。GPT - 4o 长期以来一直是这个人工智能聊天机器人平台的基础，但在此之前，该模型只能生成和编辑文本，不能生成图像。

　　奥特曼表示，对于 OpenAI 每月 200 美元的专业版计划订阅者来说，GPT - 4o 原生图像生成功能现已在 ChatGPT 和 OpenAI 的人工智能视频生成产品 Sora 中上线。OpenAI 称，该功能很快将向 ChatGPT 的 Plus 用户和免费用户以及使用该公司应用程序编程接口（API）服务的开发者推出。

　　与它实际上取代的图像生成模型 DALL - E 3 相比，具有图像输出功能的 GPT - 4o “思考” 的时间要长一些，以生成 OpenAI 所说的更准确、更详细的图像。GPT - 4o 可以编辑现有的图像，包括有人物的图像 —— 对其进行变换或 “修复” 前景和背景物体等细节。

　　为了支持新的图像功能，OpenAI 称，它使用 “公开可用的数据” 以及与 Shutterstock 等公司合作获得的专有数据来训练 GPT - 4o。

　　许多生成式人工智能供应商将训练数据视为一种竞争优势，因此他们对其及相关信息守口如瓶。但训练数据的细节也是潜在的知识产权相关诉讼的来源，这是公司不愿透露太多的另一个原因。

　　OpenAI 首席运营官布拉德・莱特卡普在一份声明中表示：“在输出方面，我们尊重艺术家的权利，并且我们有相应的政策来防止我们生成直接模仿任何在世艺术家作品的图像。”

　　OpenAI 提供了一个退出表单，创作者可以通过该表单请求将他们的作品从其训练数据集中删除。该公司还表示，它会尊重禁止其网络爬虫从网站收集包括图像在内的训练数据的请求。

　　ChatGPT 升级后的图像生成功能是在谷歌为其旗舰模型之一 Gemini 2.0 Flash 推出实验性原生图像输出功能之后推出的。这个强大的功能在社交媒体上迅速传播，但不一定是因为好的原因。事实证明，Gemini 2.0 Flash 的图像组件几乎没有防护措施，这使得人们可以去除水印并创建描绘受版权保护角色的图像。

海量资讯、精准解读，尽在新浪财经APP

责任编辑：丁文武

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Tiger Brokers

ChatGPT 图像生成功能迎来升级

Most Discussed