在过去的几个月里,OpenAI 一直在私下测试其新迭代的人工智能(AI)图像生成模型,YouTuber MattVidPro 泄露的早期样本显示,该模型优于之前的图像生成器。
“马特在他发布到 YouTube 上的预览中说:”非常令人兴奋,这比我们以前看到的任何东西都要好,太疯狂了。”Midjourney无法与这种水平相提并论,我甚至认为Midjourney第六版也无法与这种水平相提并论”。
不过,别指望很快就能试玩。访问权限极其有限。
这个未公开的模型很可能是《DALL-E 2》的升级版,目前正在 ChatGPT-4 内部通过仅限邀请的方式进行预览测试。马特说,全球只有大约 400 人可以使用这个新的 OpenAI 图像生成器。
虽然数量有限,但图像样本展示了人工智能的先进技能。它生成的图像清晰锐利,光照和反光效果与真实照片如出一辙。该模型再现了细致到笔触可见的绘画作品。它还在生成的产品上完美地再现了 “士力架 “等品牌名称和 “地铁 “等知名品牌的徽标,并在渲染的文本中实现了相当好的拼写。
虽然目前的图像生成器在处理连贯的手部图像方面存在困难,但这些示例显示了逼真、比例适当的手部图像。背景也比竞争对手的人工智能系统更有说服力。
OpenAI 显然取消了安全过滤器,以测试模型的全部潜力。用户表示,它可以毫不犹豫地生成暴力内容和裸体内容。不过,鉴于 OpenAI 对 NSFW 内容的态度,在这种标准下发布正式公开版本的可能性很小。
马特表示:”这是 OpenAI 的事,所以你可以打赌,他们在发布之前一定会像对待所有东西一样,对这个东西进行严格的审查,”
。
一些专家批评 OpenAI 为避免潜在争议而 “弱化 “其模型。一些研究甚至表明,OpenAI 训练的 ChatGPT 在输出结果中带有强烈的政治偏见。
尽管如此,样本中显示出的稳定质量仍是一个飞跃。它彰显了 OpenAI 为提高人工智能生成能力所做的不懈努力。该公司可能会在今年晚些时候公布更多进展情况,尤其是如果图像识别和生成领域有助于提高其明星产品的稳健性:多模态 GPT-4 能够在一次提示中理解文本、图像和草稿。
目前,该技术仍局限于对极少数用户进行封闭测试。
随着模型的不断改进,人工与真实之间的界限将进一步模糊。虽然这让很多人兴奋不已,但对滥用的担忧仍将存在。以负责任的方式构建这项技术仍然是一项紧迫的挑战。