1.2.2 Midjourney
Midjourney是基于人工智能技术的付费在线AI绘画软件,旨在帮助用户创作高质量的数字艺术作品,其官网首页如图1-2所示。
该软件通过先进的深度学习算法来分析和学习数百万个艺术品和图像,从而生成具有艺术风格的图像。Midjourney的核心功能是根据用户的文字提示,生成高质量、多样化、有创意的图像,即使不会用AI也可以用简单的提示词去生成很多效果不错的图片,具有灵活性、速度快、质量高、多样性和创意性的特点。
图1-2
与其他AI绘画软件相比,Midjourney有三个独特的优势。
1.算力云端化
Midjourney是一个架设在discord之上的工具,所以不用像软件一样需要安装,所有的图片都是在云上完成并训练的,只需在discord输入文本即可,在硬件方面对用户几乎没什么要求。
从成本来说,9%用于训练,80%用于制作图像的推理,所以大部分成本用在了图像上。为解决这一点,Midjourney在世界上八个不同的地区设立了自己的服务器,例如韩国、日本或荷兰等,在每个时区的夜间没有人使用GPU时,Midjourney就可以充分利用这些算力,实现GPU负载平衡。
实际上,这种依靠云端服务器来降低成本、加快模型训练的做法,与目前腾讯训练大模型的策略十分相似。在算力已经愈发成为大模型训练瓶颈的今天,如果在训练开发环节直接调用云端的大模型和AI算力资源,完成后一键分发到用户终端上,就可以大大降低成本,减少工作量。因此,Midjourney “云上计算”的这一步棋,着实是摸准了时代的方向。所以,大模型从云入端,是模型服务商实现商业化的必争之地。
2.模型维护更集中
Midjourney在参考CLIP及Diffusion开源模型的基础上抓取公开数据进行训练,从而构建自己的闭源模型和数据飞轮以适应行业技术的飞速发展。此外,通过收集用户反馈及数据标注,Midjourney不断迭代模型,在ValueChain上占据多个数据层、模型层、应用层整个技术栈。
相对封闭也成为Midjourney构建自身护城河的重要方式。因为没有公开其源代码,因此无法被广泛地研究、改进和应用,Midjourney积累的数据集具有独家性,可以进行针对性训练。
3.界面简便易用
Midjourney使用起来极为简单,注册discord账号之后,即可进入Midjourney频道,随后可以加入公测服务器。使用时,用户只需要输入命令提示符,就可以生成对应的高品质图形。它可以让用户避开复杂的使用技巧,同时可以用算法让机器想象所输入命令的样子。
这也是Midjourney能够脱颖而出的地方。凭借简单的Prompt, Midjourney借助discord社区持续迭代,社区用户将近1500万。
4.社交属性
因为Midjourney团队是一个远程工作的团队,所以建立了一个机器人。后来,团队用同样的机器人在discord上做了一个用户测试,得到的结果是,用户很喜欢这个实时交流想法,以及富有想象力的环境。
Midjourney与discord双轮驱动,激励用户点赞积累标注数据。discord为Midjourney的启动提供了绝佳的社交体验平台,成功将其带入了大众市场。一方面discord降低了用户使用门槛;另一方面,图片创作是一个在讨论中不断迭代的过程,欣赏其他用户的作品也有助于激发灵感。此外,Midjourney通过赠送免费使用时间来激励用户点赞,从而积累标注数据不断优化模型生成效果。
随着用户越来越多,Midjourney就能获取更多用于训练的图片数据,从而能够更好地进行模型迭代升级;更好版本模型的推出,就能够更好地理解用户需求产生图片升级功能,进而获得更多的用户,形成良性循环。在此基础上,Midjourney成功构建了数据飞轮。