AI文生图最大问题不存在了，最新Gemini 2.0指哪改哪，网友已经玩坏了

主要观点总结

本文主要介绍了Gemini文生图模型的更新，该模型在文生图的可控性和用户体验方面表现出色。文章详细描述了Gemini模型在局部修改、视角改变等方面的功能，并提供了使用技巧。同时，文章还提到了Google最新图像生成模型Imagen 3的一些功能，并对比了Gemini与Imagen 3在可控性方面的差异。

关键观点总结

关键观点1: Gemini文生图模型的更新突破了可控性的限制。

文章介绍了Gemini模型的更新及其特点，指出该模型在文生图的可控性和用户体验方面表现出色，率先突破了可控性的限制。

关键观点2: Gemini模型具有强大的局部修改功能。

文章通过实例展示了Gemini模型的局部修改功能，能够精准地根据指令修改图片的局部，并保持其他部分不变。

关键观点3: Gemini模型支持视角改变。

文章提到Gemini模型还支持改变视角，这对于短片故事板、产品多视角展示等非常有帮助。

关键观点4: 使用Gemini模型时需要注意一些技巧。

文章提供了一些使用Gemini模型时的技巧，如指令要简单直给，注意模糊指令的方式，以及进入Studio后的基础设置等。

关键观点5: 文章最后提到了招聘伙伴的信息。

文章最后提到了招聘信息，包括简历投递邮箱和岗位信息链接等。

正文

最近的热点实在太多了，当 Gemini 的文生图模型更新出来时，原以为只是平平无奇的小更新——万万没想到，属实是个大招。

在此之前，要么用 Stable Diffusion，要么走回 Photoshop 老路，反正还没有哪个模型，可以用如此简单的对话，就完成如此精细的修改。

Gemini 率先突破可控性这件事并不令人意外，二月时，Google 就推出了最新一代的图像生成模型 Imagen 3，当时就强化了提示词的跟随功能。

当时还只面对付费用户，现在在 AI Studio 中已经可以看到更完整丰富的呈现。可以说，在目前文生图的可控性程度，以及相对应的用户体验上，Gemini 的确做到了无人能出其右。

下面我们会具体解释为什么这样下结论。同时在测试过程中，我们也发现了一些使用技巧，一并奉上。

可控性不好？不存在了

诚实的说，单纯讲生成还是有一点不稳定，但是 Gemini 2.0 Flash Experimental 展示出了堪称逆天的修改可控性。

下面这组花田图里，使用了 Imagen 3 的官方实例：Impressionistic landscape painting of a sunset over a field of sunflowers， vibrant colors， thick brushstrokes， inspired by Monet。