Skip to content Skip to footer

谷歌推出 Imagen 2 用于人工智能图像生成

image-20240203235306287

嘿!今天,我们谈论的是一个名为 Imagen 2 的东西。这是谷歌制作的一个智能工具,可以将文字变成超逼真的图片。想象一下,告诉你的电脑在月球上画一条吃冰淇淋的龙(上图!),它就做到了!嗯,这就是 Imagen 2 可以做到的。

它比以前更能理解你告诉它的内容,并使图像看起来几乎真实。就我个人而言,我认为这比 Midjourney 或 Dall-E 需要的及时工程要少得多。另外,你可以用一些很酷的技巧来添加或改变图片的某些部分,比如画和画

但是等等,这不仅仅是没有礼貌的狂野技术;它也是为了安全而设计的。每张图片都隐藏着一个特殊的标记,所以我们知道它是由人工智能制作的。

您可以通过不同的 Google 工具(如 Bard 和 Search Generative Experience)使用 Imagen 2。学校里的孩子甚至可能很快就会在课堂上看到它们出现!

谷歌表示,这个新版本在测试中表现出色,他们检查图片质量是否良好,以及机器对我们人类的理解程度。

Imagen 2 正在改变在计算机上制作图片的游戏规则,涵盖 Google 所有很酷的东西,例如在线搜索和在实验室中尝试新想法。

准备好看看您的想象力和一些高科技帮助可以做什么了吗?让我们开始吧!

关键要点

  • 谷歌的 Imagen 2 是一种新的 AI 工具,可以将文字变成逼真的图像。它可以更好地理解字幕并创建栩栩如生的图片。
  • Imagen 2 具有修复和外绘画功能,可以修复或扩展照片,使其保持真实。
  • 它还包括用于为 AI 图像添加水印的 SynthID
  • 您可以在 Bard、ImageFX、SGE 和 Vertex AI 等 Google 服务中找到 Imagen 2。这些有助于聊天、设计、搜索等。
  • AI 在 COCO FID 和 DrawBench 中排名靠前,可以从文本制作高质量的图像。人们认为这是人工智能图像技术的一大步。

Imagen 2 的强大功能:AI 图像生成技术

image-20240203235339405

Imagen 2 的推出预示着 AI 图像生成技术的新时代,数字创作和逼真图像之间的界限显着模糊。此次升级增强了对图像与标题关系的理解,并实现了比以往任何时候都更逼真的视觉效果的飞跃——为创作者和开发者开启了变革性的篇章。

改进了对图像标题的理解

我必须告诉你,Imagen 2 改变了我们 AI 社区的游戏规则。它深入挖掘字幕并以前所未有的方式提取意义。这个工具可以真正巧妙地学习各种风格的字幕。

这不仅仅是理解单词;这是关于掌握用户提示的真正含义。

有了它,它为用户提供了变化和建议:

image-20240203235411673

ImageFX 中推荐的变体

让我们面对现实吧,让机器理解人类指令并不简单。但现在,Imagen 2 开启了我们一直以来所追求的图像-字幕兼容性的新时代。它从各种训练数据中学习的能力使这成为可能。基本上,文本到图像的用户体验变得更好了。

我们看到细微差别的捕捉方式让每个人都坐起来并引起注意——最终弥合了文本到图像模型与真正的人类创造力之间的差距。

生成更逼真的图像

现在,生成不仅清晰而且非常真实的图像变得更加容易:

image-20240203235454322

宇航员在火星上弹吉他

人脸和手看起来更加逼真,这要归功于训练数据集的进步。这些视觉效果没有我在早期的 AI 尝试中看到的常见失真。

秘诀是什么?它是经过改进的编码器和改进的对抗网络的混合体,这些网络已使用高质量数据进行了微调。这种努力最大限度地减少了伪影——那些提醒你它是计算机生成的小故障。

告别尴尬的数字缺陷;你好,光滑的纹理和自然的光线。Imagen 2 制作的每张照片都提高了人工智能在制作逼真场景方面所能达到的标准——这是跨品牌和平台(如 Google Labs 或 Vertex AI)内容创作的真正游戏规则改变者。

高级补漆和外胶涂

我对 Imagen 2 的上色和外色能力感到非常兴奋。他们让我以前所未有的方式调整图像。假设我有一张缺少角落的照片或想扩展背景;这项技术可以无缝地填充或扩展细节,就好像它是原始镜头的一部分一样。

我可以相信它保留了照片般的真实感,让一切看起来都是真实的。

Imagen 2 还帮助我通过 SynthID 集成为 AI 生成的内容添加水印。这对于发现人类与机器的创造至关重要,确保所有工作保持透明并谨慎管理风险。

它增强了我的信心,因为我知道我生成的东西的核心既先进又负责任。

设计负责

Imagen 2 反映了 Google 对负责任的 AI 实践的承诺。该系统包括强大的过滤器,可自动阻止暴力、冒犯或色情内容。

现在有点烦人tbh。检查太激进了,你不会总是知道你做错了什么(我们固有的偏见?但这是朝着正确方向迈出的一步,我们可以稍等片刻,直到他们找到正确的平衡。

就像我之前提到的,他们还在 Imagen 2 中引入了 SynthID——这是他们的数字水印技术,可以轻松识别 AI 生成的图像。该技术在消费产品上创建的每张照片都将带有唯一的 SynthID 标记

这有助于防止深度伪造等滥用行为,并保持对用户的透明度

接下来,让我们谈谈您可以在 Google 平台上找到这些高级功能的位置。

Imagen 2 在 Google 平台上的可用性

image-20240203235521106

深入研究 Imagen 2 的集成,Google 已将这一尖端 AI 与其服务套件无缝融合,为渴望探索 AI 辅助创造力前沿的开发人员和研究人员提供变革性体验——请继续关注我们解开这个奇迹。

Bard、ImageFX、SGE 和 Vertex AI

我很高兴能与大家分享 Imagen 2 如何在 Google 平台上掀起波澜。它的集成对于我们这些在创新和创造力中茁壮成长的开发人员和 AI 研究人员来说是一个游戏规则的改变者。

  • 吟游诗人(即将推出双子座?):这就是对话式人工智能的神奇之处。Bard 使用 Imagen 2 将文字转化为生动的图像,从而提升了聊天机器人的参与方式。想象一下,输入一个描述并看到它栩栩如生;这就是适合你的吟游诗人。
  • ImageFX:将 ImageFX 视为艺术家的工具包,但由 AI 提供支持。它利用 Imagen 2 的实力来创造富有表现力的芯片——微小的数字艺术作品,增强我们的视觉叙事。平面设计师现在可以以前所未有的方式处理图像。在此处访问它。
  • SGE(搜索生成体验):搜索不再只是链接和文本。借助 SGE,我们展望了一个未来,借助 Imagen 2 的文本到图像功能,查询可以即时创建逼真的图像。这可能会彻底改变我们从搜索结果中可视化信息的方式。
  • Vertex AI:对于 Google Cloud 客户(如开发人员)来说,带有 Imagen 2 的 Vertex AI 是一个宝库。这里的开发人员可以制作更详细、更准确的图像,突破 AI 驱动图像生成的可能性。

在COCO FID和DrawBench基准测试中排名靠前

作为一名开发人员和 AI 研究人员,我的注意力始终集中在该领域的进步上,尤其是在 AI 图像生成的准确性和质量方面取得的进步。其中一个重要的里程碑是 Google 的 Imagen 2 在 COCO FIDDrawBench 等既定基准测试中的性能。

image-20240203235547279

报告的基准

谷歌的 Imagen 2 在从文本中理解和生成图像的熟练程度显然树立了新的标准。该模型对高质量图像描述配对的增强训练可转化为更详细且语义一致的图像。包括我在内的行业同行都认为这些基准是进步的关键指标。

结论

这是在制作看起来像现实生活的图像方面迈出的一大步。开发人员和 AI 研究人员绝对应该检查一下,因为它可以帮助他们创建很酷的东西!