然而,他们也注意到这些模型有一些局限性。 例如,它们经常生成模糊或扭曲的图像,无法捕捉到复杂的细节或情绪,或者生成的图像与用户的意图不符。Midjourney 的创始人希望创建一种 AI 来克服这些挑战,并生成不仅逼真而且富有表现力和多样性的图像,让用户更好地控制自己的创作,让他们能够无限制地探索自己的想象力。
为了实现这一目标,他们基于最先进的技术开发了自己的专有模型,例如Transformer、生成式对抗网络 (GAN) 和自注意力机制。 他们还收集并整理了来自不同领域和流派的文本图像对的大规模数据集,经过数月的努力和测试,终于在2022年底推出了Midjourney作为在线平台,任何人都可以访问他们的AI 免费生成图像。
Midjourney的主要特点
Midjourney有几个特点使其从其他文本到图像的AI工具中脱颖而出:
- 现实逼真。Midjourney可以产生看起来逼真自然的图像,它可以处理具有多个对象、背景、灯光效果的复杂场景和视角。 它还可以捕获细微的细节,例如纹理、阴影和反光。
- 情感表达。Midjourney可以产生传达情感和情绪的图像,它可以根据用户的输入调整不同颜色、品味、和风格的图像。它还可以生成面部表情、身体语言、以及人类或动物角色的手势。
- 多样性。Midjourney可以产生多样化且独特的图像,它可以为每个输入生成多个变体,允许用户选择他们最喜欢的一个或将它们组合在一起。 它还可以在图像中引入随机元素或惊喜,让他们更有创意和乐趣。
- 交互性。Midjourney允许用户以各种方式与他们的图像进行交互, 用户可以编辑他们的输入、添加标题或应用过滤器来改变图像的外观。用户还可以在 Discord、Twitter 或 Instagram 等社交媒体平台上与其他用户分享他们的图像。