作者:Lars Nielsen
翻译:陈超
校对:赵茹萱
本文约1500字,建议阅读5分钟
本文共列举了10条如何为Midjourney编写图像生成提示的建议。
一个详细的“小抄”以及一些使用更好的提示图片输出的关键词。
图片由Midjourney生成,文字提示:美丽的、梦幻的城市虚幻引擎
对于还没听说过Midjourney的人,这里有一句话介绍:Midjourney是一个文字-图片生成APP,类似于OpenAI的DALLE-2和Stable Diffusion的DreamStudio,使用了大量网络图片(大约6亿5千万)——基于提供的文字线索生成令人惊艳的图片。现在进入了测试阶段——但是每周都会增加更多的特征……并且未来还有待想象!(目前他们的AI引擎到了3.0版本)。
原始提示文本
使用过Midjourney的人知道,在提示中形容词越多,输出越生动和独特。用户通常使用原始和直接的提示:“月亮上一个穿着燕尾服的牛仔”,将会生成以下图案:
图片由Midjourney生成——提示:月亮上一个穿着燕尾服的牛仔
但是比起朴素的原始文字提示,还有更多选项用于创造可预测的、一致的图片输出!
现在直接开启文字提示的高级选项!
这里有一些你可以生成图片变式的方式,以及一些高级设置:(详细设置请遵循下表)
1.提供关键词——‘风格’
2.风格化
3.混沌
4.分辨率
5.纵横比
6.将图片作为提示作为URL进行传递
7.对图片提示赋权重
8.对单词提示赋权重
9.过滤单词
总之,你的风格受到你选的关键词的影响——并且你可以明确你想做成哪种风格——宽泛的风格分类如下图——
Midjourney当中的风格分类——图片来自作者
1.风格——关键词
提供一组与“风格”相关的提示关键词可以基于你倾向选择的风格进行一系列不同的输出。这里有一些关键词和基于你可能想选择的风格的艺术形式/设计/艺术家/流派。
使用设计/流派作为风格
图片由Midjourney生成,提示来自作者
使用艺术家名字作为风格
你也可以将艺术家作为你的输出风格。以下是相同提示生成的样例
/想象以安迪·沃霍尔的风格画出马在落日下奔跑
图片由Midjourney生成,将艺术家作为风格,提示来自作者
使用渲染/照明属性作为样式
图片由Midjourney生成,提示实验来自作者(提示文本:“梦幻城堡”)
2.风格化输出
你可以添加设置--s <some number>(表示风格)
以下图片来自相同的提示——加上高低风格化选项。
/imagine firefighters --s 6000
图片由Midjourney生成,提示:消防员
3.混沌——增加抽象性
0-100范围内增减主题的抽象性水平
/imagine Eiffel tower --chaos 60
图片由Midjourney生成,提示:埃菲尔铁塔
4.分辨率
为了明确输出分辨率,你可以选择常规关键词,例如8K,4K,逼真 , 超逼真 , 超详细, 错综复杂的细节等等
或者你可以为可预测的输出进行标准化设置hd 和 quality / --q是两种这样的设置
/imagine red rose flower --hd
/imagine red rose flower --quality 5
5.纵横比
捏可以明确输出图片的宽度:长度比。这叫纵横比。默认输出是方形(1:1纵横比)。但是如果你想要电影化的视角——或者你只想给电脑做壁纸,可以调整纵横比。
/imagine jasmine in the wild flower --ar 4:3
如果你想要制定自定义图片尺寸,使用以下的例子:
/imagine jasmine in the wild flower --w 600 --h 300
你不能自定义纵横比——但是可以确定一些标准比例和一些非标准比例!(这里有一些例子)
图片由Midjourney生成,文字提示:“野茉莉”,文字来自作者
6.图像作为提示
如果你想获得一些类似某图片风格的输出,(当你想获得一致输出时)将图片URL传递进去。
/imagine http://www.imgur.com/Im3424.jpg box full of chocolates
生成的图片会从种子图片(你填进去的URL)和文字提示中获得线索。
你可以上传多张图片作为提示
你可以明确图片的权重(看下一条)
7.给图片提示赋权重
如果你希望你的输出看起来更像你的提示图(看上一条),给这张图片更高的权重:
(keyword : --iw <number>)
/imagine http://www.imgur.com/ks34f24.jpg chocolates --iw:4
8.给文字提示赋权重
/imagine wild animals tiger::2 zebra::4 lions::1.5
9.从图片中过滤文字
使用—no关键词来去掉图片中不想要的主体:
/imagine KFC fried chicken --no sauce
10.最后,你可以尝试一些有趣的关键词
* Sony Alpha α7, ISO1900, Leica M, = to specify any lens type or camera type
* photorealistic , ultra photoreal , ultra detailed, intricate details, = to specify some possible details and a realistic look and less of artistic
* unreal = to specify an unreal engine feel
* volumetric light , cinematic lighting = to specify some lighting conditions
总结
我们讨论了你在Midjourney实验中如何对输出的图片进行一定程度的控制。但是现在尚未完成。仍然有大量的想象和实验空间。尝试不同的提示并对你的创造而感到开心吧,祝你好运!
相关参考:
文本到图像生成的创造力 JONAS OPPENLAENDER,韦斯屈莱大学,芬兰https://arxiv.org/pdf/2206.02904.pdf
为了尝试一些文本提示,这里有一篇文章(https://pythoslabs.medium.com/lessons-learnt-from-using-midjourney-v4-and-some-awesome-images-generated-text-prompts-included-2153dc02db4a),其中包含Midjourney生成的一些非凡图像 - 一些示例图像。
原文标题:
An advanced guide to writing prompts for Midjourney ( text-to-image)
原文链接:
https://medium.com/mlearning-ai/an-advanced-guide-to-writing-prompts-for-midjourney-text-to-image-aa12a1e33b6
编辑:王菁
译者简介
陈超,北京大学应用心理硕士,数据分析爱好者。本科曾混迹于计算机专业,后又在心理学的道路上不懈求索。在学习过程中越来越发现数据分析的应用范围之广,希望通过所学输出一些有意义的工作,很开心加入数据派大家庭,保持谦逊,保持渴望。
翻译组招募信息
工作内容:需要一颗细致的心,将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生,或在海外从事相关工作,或对自己外语水平有信心的朋友欢迎加入翻译小组。
你能得到:定期的翻译培训提高志愿者的翻译水平,提高对于数据科学前沿的认知,海外的朋友可以和国内技术应用发展保持联系,THU数据派产学研的背景为志愿者带来好的发展机遇。
其他福利:来自于名企的数据科学工作者,北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴。
点击文末“阅读原文”加入数据派团队~
转载须知
如需转载,请在开篇显著位置注明作者和出处(转自:数据派ID:DatapiTHU),并在文章结尾放置数据派醒目二维码。有原创标识文章,请发送【文章名称-待授权公众号名称及ID】至联系邮箱,申请白名单授权并按要求编辑。
发布后请将链接反馈至联系邮箱(见下方)。未经许可的转载以及改编者,我们将依法追究其法律责任。
点击“阅读原文”拥抱组织