AIGC项目:FaceChain一周2.5k star,3张照片出个人写真

本文来源  机器之心编辑部

一个名为 FaceChain 的开源项目可以用 AI 模型打造人物写真。项目上线一周,已经狂揽 2.5k star,今天还上了Github趋势排行榜第一名。

04af097760327a9f229079fe7f2a394b.jpeg

项目地址:https://github.com/modelscope/facechain

用户仅需提供最低三张照片,就可以获得特定风格的个人写真。例如,生成商务证件照:

fe559ee450e8aa1625a3d45d78c3ecbd.png

也可以在 ModelScope 创空间中直接体验这项应用,无需任何安装步骤。

641f46f53707cd918f7cfa464e405a09.png

试玩地址:https://modelscope.cn/studios/CVstudio/cv_human_portrait/summary

fe1d6638446770f0aea727db2f38b86e.png

7212529e16b570d647f874b700f50d7a.png

作者在项目介绍中讲解了 AI 生成个人写真的技术原理,解释了生成式 AI 模型如何成为「写真神器」,我们来看下这部分讲解内容。

个人写真的生成原理

基本原理

AI 生成个人写真的能力来源于 Stable Diffusion 模型的文生图功能,—— 输入一段文本或一系列 prompt,输出对应的图像。而影响个人写真生成效果的因素主要有两方面:写真风格信息和用户人物信息。

为此,项目作者分别使用线下训练的风格 LoRA 模型和线上训练的人脸 LoRA 模型来学习上述两方面的信息。LoRA 是一种具有较少可训练参数的微调模型,在 Stable Diffusion 中,可以通过对少量输入图像进行文生图训练的方式将输入图像的信息注入到 LoRA 模型中。

1cbc2e2d14d4b0b5940c030b71a287b7.png

因此,个人写真模型的能力分为训练与推断两个阶段,训练阶段生成用于微调 Stable Diffusion 模型的图像与文本标签数据,得到人脸 LoRA 模型;推断阶段基于人脸 LoRA 模型和风格 LoRA 模型生成个人写真图像。

训练阶段

训练阶段的输入是用户上传的包含清晰人脸区域的图像,输出是人脸 LoRA 模型。

具体来说,项目作者首先使用基于朝向判断的图像旋转模型,以及基于人脸检测和关键点模型的人脸精细化旋转方法,来处理用户上传图像,得到包含正向人脸的图像;接下来使用人体解析模型和人像美肤模型,以获得高质量的人脸训练图像;随后,该项目使用人脸属性模型和文本标注模型,结合标签后处理方法,产生训练图像的精细化标签;最后使用上述图像和标签数据微调 Stable Diffusion 模型得到人脸 LoRA 模型。

推断阶段

推断阶段的输入是训练阶段用户上传图像和预设的用于生成个人写真的输入 prompt,输出是个人写真图像。

在推断阶段,该项目首先将人脸 LoRA 模型和风格 LoRA 模型的权重融合到 Stable Diffusion 模型中;接下来使用 Stable Diffusion 模型的文生图功能,基于预设的 prompt 初步生成个人写真图像;随后,该项目使用人脸融合模型进一步改善上述写真图像的人脸细节,其中用于融合的模板人脸通过人脸质量评估模型在训练图像中进行挑选;最后再使用人脸识别模型计算生成的写真图像与模板人脸的相似度,以此对写真图像进行排序,并输出排名靠前的个人写真图像作为最终输出结果。

项目作者已详细介绍安装与使用方法,并将项目代码开源,感兴趣的读者快去试试吧。

关注公众号【机器学习与AI生成创作】,更多精彩等你来读

卧剿,6万字!30个方向130篇!CVPR 2023 最全 AIGC 论文!一口气读完

深入浅出stable diffusion:AI作画技术背后的潜在扩散模型论文解读

深入浅出ControlNet,一种可控生成的AIGC绘画生成算法! 

经典GAN不得不读:StyleGAN

a11d200b6ee032e8e57920c49a2bb5a9.png 戳我,查看GAN的系列专辑~!

一杯奶茶,成为AIGC+CV视觉的前沿弄潮儿!

最新最全100篇汇总!生成扩散模型Diffusion Models

ECCV2022 | 生成对抗网络GAN部分论文汇总

CVPR 2022 | 25+方向、最新50篇GAN论文

 ICCV 2021 | 35个主题GAN论文汇总

超110篇!CVPR 2021最全GAN论文梳理

超100篇!CVPR 2020最全GAN论文梳理

拆解组新的GAN:解耦表征MixNMatch

StarGAN第2版:多域多样性图像生成

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 |《计算机视觉中的数学方法》分享

《基于深度学习的表面缺陷检测方法综述》

《零样本图像分类综述: 十年进展》

《基于深度神经网络的少样本学习综述》

《礼记·学记》有云:独学而无友,则孤陋而寡闻

点击一杯奶茶,成为AIGC+CV视觉的前沿弄潮儿!,加入 AI生成创作与计算机视觉 知识星球!

猜你喜欢

转载自blog.csdn.net/lgzlgz3102/article/details/132680428