The following article is from 元住民 Pro Author 瑗瑗子
本文仅代表个人工作流总结 & 行业思考,较为粗糙,并无阐述过多技术点。如有其他想法欢迎交流。
有部分科普性质文字,同专业同学可以只看第 4 和第 5 部分。
导读:
1. 不同 AIGC 软件效果图
2. 原理阐述 & 软件选择
3. AIGC 工业化到底是什么
4. 举个例子
5. 不同业务要求下 AI 能够介入的程度,对设备及人员的要求
6. 我所看到的盈利方向
7. AI 对于我个人的影响
01
不同 AIGC 软件效果图
目前 AIGC 的主流软件有 midjourney 和 stable diffition。
我用 mj 生成的产出图:
我用 sd 生成的产出图:
可以明显看出,mj 的生产图精细度更高,画面更细腻;sd 则质量稍差一些。二者根本区别在于,sd 的底层框架是开源的,而 mj 是闭源的。
02
原理阐述 & 软件选择
开源的本质含义是——我可以自由的选择这项技术的任何节点,自我改造成适应我业务的模式;所以大多数情况下,适合介入工业化的软件都会是 sd 而不是 mj。
03
AIGC 工业化到底是什么
与业务美术风格(画风)一致的前提下,AI 可以根据项目的具体需求,快速大量出图解决需求 or 提高解决需求的效率;使人工成本降低,生产力提高。
美术要求越低越少、量越大的业务,AIGC 可用价值就越高。
具体落地的核心点只有两个:
1. 可以训练出与项目画风一致的大模型。
2. 可以结合软件快速完成多种多样的个性化需求。
04
举个例子
我个人在工作和个人创作中针对 AI 跑了很多条工作流想去节约自己的时间和提升效率,基于时间和隐私问题我就不再这里展开讲述,只是拿出基本的思路拆解给大家举个小例子。
某小业务的画风来源于一名叫 rinotina 的韩国画师,现有数字人 / 角色需求如图。
AIGC 会如何介入?
第一步
1. 找到画风一致的素材图 70-100 张左右。
2. ? 打 tag。
3. 测试数据分批试跑 直至找到风格最接近且稳定的 lora。(目前不太推荐 loha,乘积参数变量太大)
第二步
结合软件快速完成多种多样的个性化需求。
这里我推荐我个人的两种工作流,:一种是面对想法少时间赶的文生图法,第二种是想法偏多的图生图法。同理,想法越多,设计师介入程度越高。
文生图:
1. 将需求转化为关键词。
2. 适当调整并输入。
3. 选图。
4. ? 我认为这张不错。
可以看到这张图还存在诸多的细节问题,但已经可以基本满足 60% 需求了。从生成到选图,花费时间在 3h 左右。剩下的细节设计调整,就需要靠设计师手动调整,并与需求方强交接。
这套文生图的方法流更多是做一个大方向的快速出具,给需求方更多选择后,靠设计师自行迭代完善。不过也可以用于需求方给美术出具参考图的环节。
图生图:
1. 如果需求方并没有那么确定自己的想法,那么画师前期可以多尝试一些草图,确认大方向。
2. 利用插件 controlnet 介入,拒绝不稳定生成。
Controlnet 集合多个处理器,如 canny 线稿检测、openpose 姿势检测等,将其他图片的内部信息检测后可应用到自己的图片创作中来。
将草图导入 controlnet,让后启动了 hed 处理器。(我个人觉得这个处理器比较全面,所以喜欢用这个 )
3. ? 设计师高强度介入,反复叠图修改。
4. ? 这张相对是比较想要的感觉。
这样一张图基本可以达到最终效果的 80%,它的设计在画师和 AI 的不断修正中已经基本确定,欠缺的是细节的调整和补充。这样的工作流,更适合想法偏多、磨合更多的需求当中。
不同业务侧,需求不同。
结合需求和 AI 介入程度,自行打造管线即可。例如,在某画风确定且有大量美术素材的游戏项目中,想利用 AI 节省美宣成本,那管线可以是:
固定角色 lora+场景 lora+画风 lora 或画风大模型,搭配文生图 or 图生图任意工作流。
05
不同业务要求下 AI 能够介入的程度,
对设备及人员的要求
所有业务对于 AI 介入的底层逻辑思路,其实都是一致的。
想法越多、对于内容的确定性越强,AI 的介入程度就会变得越低。
AI 无法顶替设计师,它始终是作为工具的辅助性存在。文娱内容向的产品,重要的从来都是内容,而内容作为感性产物,始终需要设计师人为感应市场和他人的诉求后,做出选择和决定。要求越高,那么美术皮下的内容和想法就越重要,AI 的介入程度就越低,否则反之。
买量向产品、大众市场高迭代向产品,不管是品牌还是游戏,AI 介入应该都是笔划算的买卖。此类业务中,AI 没有办法做到 90 分,但可以达到 70 分,只要保证模型稳定需求清晰,可以提升 20% 甚至 30% 的前期美术效率。
但在偏高品质、要求高想法的业务中,AI 对于 UI、UX、插画、原画、平面设计等工种来说,更多是提供局部流程上的改善,整体提升效果偏弱。
AIGC 目前对于设备的要求尚可,sd 本地部署基本需要 2080 的显卡及以上,云端部署对于中小业务来说是不错的选择。
而训练同理,Lora 等小模型目前的开源训练包已经非常成熟,主要是分批测试较为花费时间成本;而对于使用者来说,sd 和 mj 的学习成本并不算很高,对于审美和需求磨合能力的要求,远高于对技术能力的要求,基本大多数需求方里 1 至 2 名设计师配合等比技术即可。
AI 的多应用方向:
UI、字体,都是可以被做成模型的应用方向。
06
我所看到的盈利方向
我个人认为,想要盈利,目前缺乏的是挖掘 AI 到底能被融入到哪些需求中的洞察力,而不是单一专注于 AI 技术本身。就像我在文章开头说过的,sd 能应用工业化是因为它开源,但开源的技术一般都难以盈利。
sd 直接盈利很难,不过拿来封包做应用应该没那么难。尤其是做成妙鸭相机的甜品级应用(用户诉求不高、量大、单一),或是 to B 的业务应用(封包管线)。
更多是通过一种将需求转化为可应用的能力,来达到盈利目的。
07
结尾
其实笔者作为一名画师,在刚接触 AI 时是极度焦虑的,甚至认为自己会失业,想要转变职业走向去逃避 AI。但在一次次学习尝试和摸索中,我发觉 AI 的出现让画面做精美的难度,的确比之前大大降低。同时,市场对画面故事性、情感性、风格特殊性的要求,也会大幅度增加。
也就是说,大家对于内容的要求增加了,本质变化是,我需要在日后漫长的职业生涯里,学会预判下一步市场会喜欢怎么样的美术,什么创新尺度是观众可以接受的,我做的设计表达出来的内容观众能否第一时间感知到,这些内容是否也能引起他人共鸣……这些成了我的新职业命题。
我画的每一张画都不是画,是一个内容的其中一部分。单一精美的画面没有用,但如果是一百张精美连在一起的画面,伴随着一个个故事、设定、玩法、模型、动画,就成了新内容的开始。
那内容的内核对于我来说,究竟是什么呢?
就好像《蜘蛛侠:平行宇宙》一样,在多个宇宙里,蜘蛛侠可以是黑色或白色,人类或动物,画风也会有变化……但只要他被一个蜘蛛咬了一口,爬到高楼之上,那他就是蜘蛛侠。
我爱蜘蛛侠。
游戏葡萄招聘内容编辑,