ChatGPT Images 2.0实测登场!首加思考模式 生成繁体中文不乱码

撰文: 免费资源互联网社群
出版:更新:

去年Google推出Gemini 3 Pro Image,AI图片生成技术就来到一个新的境界,对于会使用AI制作图片的使用者来说,几乎成为不可或缺的工具。

近期OpenAI推出全新AI生成图片功能“ChatGPT Images 2.0”(gpt-image-2),不只让画面变得更细腻,还加入“思考模式”,可一次生成多张风格一致的图片,更重要的是支援多语言文字与排版,遇到中文也能正确显示。这次更新用于接替去年12月推出的 Images 1.5。

近期OpenAI推出全新AI生成图片功能“ChatGPT Images 2.0”(gpt-image-2)(OpenAI)

以往 AI 生成图片(例如DALL-E 3)虽然画面很精美,但遇到繁体中文通常就会出现乱码,也就是大家很熟悉的中文看似正常、仔细看却又不是文字的问题。

这次更新不只是单纯提升图片精细度和画质,还解决中文创作者最在意的文字精准度问题,让中文创作者在Gemini 3 Pro Image之外,有了另一个生成中文图片的AI工具选择。

ChatGPT Images 2.0思考模式与联网功能

这次更新最大的亮点是为图片生成加入“思考模式”,在生成图片时,可以明确看到AI路径中会进行思考,从一开始会先理解需求、进行规划,最后才会生成图片,并反复验证图片内容有没有问题。

当付费版使用者选择“思考模式”(Thinking)后,Images 2.0还会搜寻并抓取互联网上的资料、即时生成图片,不同于以往我们可能要手动去找资料、在生成图片时将资料提供给 AI,这对于图片生成来说是相当大的跃进。

支援长文本处理 一次生成多张一致图片

互联网上也已经有不少透过此工具生成的图卡,使用者会发现,这次更新的另一项特色是“支援长文本处理”,一张图片上可以包含相当完整的资讯量,在长标题、副标题或内容部分也能完美呈现,使图片更贴近社群图卡、海报、菜单等实际应用场景,使用者无需进行二次编辑处理。

不过,使用AI生成的图卡其实也有相当程度的可辨识度,几乎一眼就能辨识出来。另一项演进是Images 2.0最多可生成一整组内容,并且保持角色与风格一致,漫画或设计稿终于不用再一张一张生成、手动拼凑,而是可以直接产出完整系列,这也显示AI在生成图片时具有更好的生成逻辑和推理能力。

解决中文乱码痛点 自由调整图片比例

这次ChatGPT Images 2.0更新在香港有相当高的讨论热度,最大的原因是终于支援中文、日文等多种语言!以往在遇到中文时,看起来像是中文,实际上却是乱码,并不能直接使用生成的图片,设计师依然需要手动编辑、加入文字,这次的更新也算解决过去最大的痛点!

此外,Images 2.0图片尺寸与比例的弹性是一大亮点,生成的图片不再局限于几种比例,加入更多的长宽比,提高画质与解析度上限。这也意味著AI生成图片将能直接对应到使用场景,无需透过编辑软体进行二次加工。

【延伸阅读】AI耶稣陪你视像通话?美国公司推新服务 祈祷要收费每分钟收$16(点击连结看全文)

+5

网站资讯

网站名称:ChatGPT
网站连结:https://chatgpt.com/

ChatGPT Images 2.0使用教学

1. 开启对话框并输入提示词

开启ChatGPT后点选对话框下方的“制作图片”就能进行AI图片生成,或是在输入提示词时描述要生成的图片。

开启ChatGPT后点选对话框下方的“制作图片”就能进行AI图片生成,或是在输入提示词时描述要生成的图片。(OpenAI)

在生成图片时,ChatGPT会预先提供一些灵感范本,使用者可直接点选并带入使用(进行测试),也能稍作调整、加入图片进行修改等操作,主要是这些提示词都写得很完整详细,在使用时可以拿来作为参考。

2. 观察思考流程与生成结果

以下我就透过这段提示词,让AI为我生成符合的图片。

ChatGPT Images 2.0根据提示词生成过程:

请画出一张羽毛球如何正确击球的流程图并附上简单说明,包括四个步骤:引拍、发力、击球、跟随动作,说明文字使用繁体中文,日本流行杂志风格。

现在ChatGPT Images 2.0生成图片时,会显示目前的流程步骤,可以看出一开始先思考、汇整资讯后开始生成,最后还会反复思考,进行图片内容的验证,相较于以往,ChatGPT Images 2.0准确度更高,生成速度也很快。

这次ChatGPT Images 2.0生成的图片更为专业!很像是海报或是社群图卡的感觉,图片上只有使用者要求的内容,还会填充标题、副标题或是更多资讯,例如一些重点提醒、呼吁,让画面看起来完整度更高,只有一些细节需要编辑,但相信透过AI反复来回,应该也能直接在上面完成操作,几乎不需要手动调整。

3. 利用参考图进行风格重绘

接著我选择一张图片,让ChatGPT Images 2.0进行参考、修改和编辑,重新生成类似的画面,下图是我找了一张梗图并要求ChatGPT重新绘制成动漫风格,使用繁体中文,用于确认中文可正确显示。

ChatGPT Images 2.0通过参考图进行风格重绘:

以下是我使用的提示词范例:将这张图片重新绘制成动漫风格,使用繁体中文,要保留图片中的文字。最终生成的效果来得更为细致,而且真的是充满动漫效果,非常强大!

ChatGPT 免费版可以使用吗?

好消息是这次ChatGPT Images 2.0更新,也提供给免费用户使用,即使是免费用户也可直接享受到中文正确显示、思考能力和精细度提升等特性,不过“思考模式”(Thinking)、更高解析度(2K)和一次生成多张图片等功能仅限于付费用户使用。

但我在免费版获得的基本功能,已符合大多数的使用情境了,其实也不一定要付费升级。

【延伸阅读】想AI生成神图却不知指令?这款神器能逆向破解咒语 让创作无忧(点击连结看全文)

+3

【本文获“免费资源互联网社群”授权转载。】