离职Google后,她做下?代AIGC引擎,获GGV、高瓴资本等投资








2015年前后,商汤科技、旷世科技等作为上一代AI浪潮的代表性公司,所做的工作主要是图形、文字识别以及安防等;而对于正在到来的下一代AI浪潮来说,AI的作用不再是判断“对不对”或“是不是”,而是作为一个“半人类”,辅助人类提高创造水平。



在PGC(Professional Generated Content,专业生成内容)与UGC(User Generated Content)之外,AIGC作为一种新的内容生产方式正在走入大众视野。

根据中金所发布的报告,AIGC指的是一种通过AI技术来自动或辅助生成内容的生产方式。通过输入指令,人类让AI去完成冗杂的代码、绘图、建模等任务,从而生成内容。

让AIGC大规模发酵的导火索事件发生在2022年8月31日,当日由AI生成的画作《空间歌剧院(Thétre D"opéra Spatial)》在美国科罗拉多州博览会的数字艺术类美术比赛中获得第一名。

该奖项的授予除了进一步展现出AI的能力,同时衍生出了一系列伦理与版权问题,关于“AI能否替代绘画工作者”的议论不绝于耳,“AI所替代的是‘实现’层面的工作,人类创造需要情感、欲望、感受等,而这些是AI所不具备的。”在ZMO.AI创始人兼CEO张诗莹看来,随着线上化程度越来越高,人类对于优质内容的需求也将呈指数型增长,在这个过程中,借助AI可以极大降低内容创作门槛,人人都将成为内容创作者。

ZMO.AI成立于2020年,是一家AIGC引擎平台构建公司。ZMO.AI从电商切入,旨在通过提供人工智能模特图片解决方案,降低拍照时间与成本,提升电商转化率。在进行了近两年的积累后,ZMO.AI推出了AIGC引擎——“Yuan初”。“Yuan初”通过几个文字关键词便足以使AI自动生成用户所需要的图片。

微信图片_20221114105811.png- Yuan初生成图像 -


融资方面,2022年5月,ZMO.AI完成800万美元pre A轮融资,投资方为高瓴资本、金沙江创投、GGV纪源资本;2021年5月,ZMO.AI获金沙江创投、GGV纪源资本天使轮投资。

底层技术更新
AIGC行业迎来发展小高潮

张诗莹拥有UCLA的电气工程硕士学位,创立ZMO.AI前,其曾是Apple Air Pods产品线创始团队核心人员,主要负责产品线的系统构架研发、设计、生产整个流程;之后张诗莹又加入Google 担任AR系统构架师,负责Glass、Reflector等项目的算法和构架。

在多年从业过程中,张诗莹看到了内容行业所面临的供需不匹配问题:当疫情使用户将越来越多的时间置于线上时,其对于内容的质量与数量要求越来越高,但原有的PGC内容量受限,UGC的加入虽在一定程度上缓解了内容数量问题,却也使整体的内容生产质量变低。张诗莹认为,当人类对内容的需求呈指数型上升时,仅靠人力生产将无法满足,此时,AI将走上内容生产舞台。

而从AI的发展历程来看,AI也恰好走到了一个新的浪潮下。过去AI所扮演的角色更多是进行判断,随着技术的不断突破,AI可以进行创作与生成,“我们认为AIGC是AI的下一波浪潮。”

在以上底层发展规律的支撑之下,AIGC势必会迎来高速发展期,而其之所以能在今年下半年开始爆火,主要是AI绘画产品关键技术的突破。

过去AIGC更多应用在自动续写小说、剧本等领域,但图形与文字属于两种模态,一直以来,两种模态之间难以实现跨越。在生成模型赛道,此前多是应用生成对抗网络(GAN),GAN通过对抗学习的方式,同时训练一个判别器和生成器,两者互相对抗互相促进提升,最终使生成器生成出以假乱真的真实图像,让判别器难以判断是真是假,以达到纳什均衡。

但该种框架在文字生成图片领域的应用仍存在较多问题,比如在操作上因缺乏大模型的加持,文本与图像多模态之间的关联性难以充分学习,导致在非限定场景中的效果较差,甚至在很多情况下,用户无法通过文本调整生成结果。

而今年Diffusion model框架的理论开始被应用在了图像生成领域,Diffusion框架在大数据训练下所产生的效果更好,通过Diffusion框架训练出的模型,内容质量可媲美自然界的高清图像。

微信图片_20221114105815.png- Yuan初生成图像 -


Diffusion model与Open AI提出的CLIP模型相结合,二者一方提高了图像的生成质量,另一方可以使AI准确理解用户所输入的文字,最终使得AIGC图片在今年迎来了大爆发。

巨头纷纷展开布局,谷歌、Meta等纷纷发布从文字生成视频,微软推出disigner工具,将DALL-E内容生成功能集成到自己的设计编辑软件内。Stable Diffusion、Midjourney、Make-A-Scene、NUWA等平台短期内迅速完成了用户积累,其中Midjourney在两个月收获了一百万用户。

做AIGC平台
服务于所有行业

据张诗莹介绍,ZMO.AI从成立之初便一直在生成式AI领域探索。

时尚电商是ZMO.AI最先切入的行业,当时随着Shein等一批时尚电商的崛起,耗时耗力、成本较高的图片拍摄上传流程越来越难以满足极速扩张的SKU的需求,ZMO.AI基于GAN创造了一款自定义模特的软件,商家通过简单地设置面部、身高、肤色以及身材等参数便可以创建服装模特。

除了当时时尚电商行业所面临的痛点较为明显,ZMO.AI最初选择从该行业切入主要是基于两个因素:第一,创业初期ZMO.AI内容生成模型的通用性并不强,为了在某一领域做到十分精专,ZMO.AI瞄准了商用可能性最强以及对照片需求最大的电商领域;第二,在张诗莹团队看来,电商是对图片质量要求最高的行业之一,如果系统可以在电商领域实现商用,则也大概率能够满足其他领域的需求。

但张诗莹团队从一开始想做的便是一家提供底层技术与引擎的公司来服务于所有行业,而非针对某个特定行业提供图片。“电商比较容易盈利,但我们并非以盈利为目的与商家进行合作,我们并不需要为销售量、点击率负责,而是从数据和算法层面与之合作。”在张诗莹看来,这个行业最接近商业化的算法与数据,而非生产出的一幅幅图片。

所以在上文中所提到的技术就绪之后,今年9月,ZMO.AI推出了AIGC平台Yuan初。


通过文字的输入,Yuan初便可以生成真实的照片、3D形象、插画、动漫、游戏中的人物形象等。

微信图片_20221114105824.jpg- Yuan初生成图像 -


具体来讲,Yuan初与其他AI绘画平台相比,具备以下几项优势:

第一,生成的照片高清逼真、光影自然。借助在电商行业的积累,Yuan初获得了大量的内容生成与数据反馈,并在此过程中不断提升生成模型对于照片光影、细节的处理能力,如果不仔细分辨,很难看出究竟是AI生成还是人类拍摄的图片。

第二,Yuan初生成的3D模型细节更考究。Yuan初可以适应常见的材质,比如塑料、亚克力、玻璃等,在不同材质下呈现出不同的质感与光影效果。

第三,Yuan初生成出的插画更加符合现代插画师的艺术感觉。Yuan初在生成模型的训练中借鉴了业内专业插画师的作品,团队通过和网页,PPT, 海报插画师大量合作后,获得了一些专业素材,这使其可以处理一万种插画风格,最终保证能够适配不同行业的设计师需求。

第四,Yuan初对于真实产品具备设计能力。以建筑行业为例,一般需要设计师先画草图、再绘制彩绘图、最后形成3D图,而借助Yuan初,设计师输入想法便可以得到最终的想要的设计图。

第五,Yuan初具备文字版Photoshop的功能。Photoshop拥有着极为强大的功能,但其操作复杂,长期以来被作为一项专业技能,这就使得用户使用Photoshop进行创作的门槛极高,Yuan初可以做到,用户不需要学习Photoshop,借助平台的文字描述和擦除功能,便可以获得真实感较强的图片。

微信图片_20221114105831.gif- Yuan初生成图像 -


以AI进行Photoshop的难点在于如何使光影和谐同时降低PS感,在此类问题上,Yuan初也遇到了非常多阻碍,其在处理过程中加入了3D,并对算法结构与细节进行了调优处理,最终使得生成的内容更真实。

目前Yuan初的用户包含工作需要生成基础元素的设计师与插画师,需要产出大量内容的博主与社交媒体内容工作者,游戏、动画形象的设计师,以及需要进行Photoshop的人群(以电商用户为主)。

在张诗莹看来,未来内容生产方式将会产生巨大的变革——一种全新交互式内容生成模式将成为主流。“现在平台会根据算法为我们推荐我们所喜欢的内容,但这些内容是静态的,并不会因为推荐给不同用户而发生改变。在未来,内容生成可以是实时高效,并会根据用户的不同产生变化的。”

这种模式之下,内容领域变得更加精准与个性化,内容消费者也会在无形中变成内容生产者,而在这背后,需要AI承担起“实现者”的角色。

我们是设计师、工程师、梦想者,是您扬帆出海的私人顾问专家


相关内容:
2022年日本主机游戏市场:小幅回暖,软件销量两极分化
2022年日本主机游戏市场:小幅回暖,软件销量两极分化
原标题:2022年日本主机游戏市场:小幅回暖,软件销量两极分化!作者:游戏智库题图来源 | pexels根据综合游戏媒体 Fami 通的估算,2022 年日本国内主机游戏市场产值达到 3748 亿 2000 万日元,同
Nexon公布DNF开放世界新作,但手游国服遥遥无期?
Nexon公布DNF开放世界新作,但手游国服遥遥无期?
原标题:Nexon公布DNF开放世界新作,但手游国服遥遥无期?作者:绵绵来源:游戏茶馆题图来源 | pexels1 月 12 日,NEXON(乐线)公布一款基于《DNF》世界的新企划“Project DW”,为开放世界动作 RPG

TG客服:@SSjiejie — 官方频道:@SSwangluo

三生网络 © 2009-2023 超15年出海经验,跨境项目专家