文章主题:
为了让你快速上手从 0 到 1 的绘图流程,在这篇文章中,我们将重点讲解 Prompt 提示词。
1、解析提示词的概念
在深入讲解之前,我们首先来了解一些基本概念,以便更好地学习和理解。
提示词,也就是 Prompt,主要是指用户输入的文本或图像信息,其目的是为了引导模型根据特定需求生成相应的作品。简单来说,就是用来告诉 AI 我们想要创作什么样的图片,这可以被理解为一种与 AI 沟通的特定格式的语言。
在之前的文章中,我们介绍了 SD 的「文生图」和「图生图」两种功能。
「文生图」主要通过文字与 AI 模型沟通,而这就需要使用到我们的提示词。
「图生图」则是通过图片来传递信息给 AI 模型,这里同样会用到提示词。
提示词在 AI 绘图中的应用范围非常广泛,包括但不限于图片的主题、风格、场景、人物特征、服装特点和其他额外参数等。
有时候为了生成一幅图片,我们可能需要用到十几行的提示词。事实上,许多提示词都是固定和规律的。
描述越详细,提示词就越长,AI 模型就能更精确地输出与我们需求一致的作品。
2、分类与书写提示词
那么,我们该如何书写提示词呢?
书写提示词其实没有严格的限制,不管你输入什么,AI 都会尝试为你生成一幅图片。但如果你想让 AI 更准确地理解你的需求,那么掌握基本的语法和规则是非常必要的。
以 SD 为例,在「文生图」操作中,你会看到输入「正向提示词」和「反向提示词」的区域。
首先,提示词仅支持英文输入。如果你的英语水平尚可,你可以直接输入英文;否则,你可以借助翻译工具。
其次,提示词应以词组为基本单位,各个词组之间用英文逗号「,」分隔。
例如,如果你想要 AI 为你生成「一个又高又瘦的女生和一杯又浓又香的咖啡」的图片,你可以将其拆分为以下词组:「女生, 高, 瘦, 咖啡, 浓, 香」。
这样,AI 就能更好地理解你想要生成什么样的图片,甚至比口头描述更加精准。
根据以上提示词,你可以尝试直接生成图片。可能结果会符合你的期望,但也可能会出现一些奇怪的效果。这是因为 AI 在处理时具有一定的「随机性」,每次生成的图片都不会完全相同。
例如,「一个又高又瘦的女生,和一杯又浓又香的咖啡」这个描述其实非常抽象和简短。这个女孩是学生还是上班族?时间是白天还是夜晚?场景是在咖啡店还是在家里?这些都是 AI 无法从简短的描述中得知的信息。
因此,如果提示词过于抽象和笼统,AI 就只能根据自己的理解随机生成一幅图片。
实际上,一个完整的提示词通常是通过不断与 AI 调试、逐步细化和微调而成的。
那么在提示词的基础上我们还需要添加哪些内容呢?
我们可以将其简单概括为以下几大类,以方便你在微调关键词和补充细节时,能够迅速找到合适的词组,从而快速生成你想要的作品。
主要包括五类:人物特征提示词、环境提示词、场景提示词、视角提示词、画质提示词。
例如,我们可以将前面的提示词进一步细化和补充,形成一组标准化的提示词,以便更好地引导 AI 生成高质量的图片。参考如下:
1 girl, high, thin, coffee, thick, fragrant,
✨👗金发女神在晴朗户外的一天里,👀 笑容满面,长发随风轻舞。蓝天白云作背景,温暖阳光洒下,捕捉到的瞬间定格成一幅生动的美景——她的美丽与快乐仿佛被大自然拥抱,近景中她的笑容如夏日花朵般绽放,每一刻都散发着自然的魅力。📸 #户外写真 #美丽女神 #蓝天白云
🎨✨最高品质🌟Ultra-detailed Masterpiece🎨 – 体验8K极致细腻!🔥CG Unity的8K壁纸,每一像素都精心雕琢,让你的眼球沉醉于超现实的艺术盛宴。🌍无论你喜欢哪种风格,从未来科幻到古典艺术,这里都能找到你的完美壁纸。💖立即下载,让您的屏幕独树一帜,尽享无与伦比的视觉享受!链接:[隐藏] #8Kwallpaper #CGart #细节控必选
painting, illustration, anime, game cg,这种标准化的提示词可以使我们的图像更加细致和丰富。
使用这些标准化提示词后,是否感觉图像的质感和细节更加丰富了?
至此,我们实际上已经很清楚地了解了如何从零开始编写提示词。提示词的结构已经为你清晰地划分出来。
如果想要让AI更准确地理解提示词,内容应该既丰富又有明确的标准。
另外,我还为你提供了一个如何书写提示词的模板。点击下方链接并关注我们的公众号后,在后台回复「提示词模板」即可获得。
提示词的词组化结构在微调时非常方便,不需要重新组织整个语句,只需直接修改对应的词组即可,图像也会根据这些修改进行相应的变化。
3、提示词权重与负面提示词介绍
你可能已经注意到,我们的提示词中有些是带有特定的符号,如 ( ) 或 { } 。这些符号代表什么含义呢?这正是本节要讲的「提示词权重」。
在现实场景中,当你在书写描述时,可能会有多个描述词组。例如,你可能描述了头发的长度(long hair)、衣服的颜色(white dress)以及面部表情(smiling)。但AI可能并不总是能够准确地识别所有的描述。
对于这种情况,我们可以通过调整权重来强调某个词组的重要性,使其在图像中更加突出。增加权重主要有两种方法:一种是使用括号,另一种是使用数字权重。
经过权重调整后的图像,是否感觉加权的提示词更加突出了?
当你发现某些描述没有被AI准确地反映在图像中时,你就可以考虑「增加提示词权重」来强调它们的重要性。
但是,请注意不要将权重设置得过高,这可能导致图像内容严重失真。
一般来说,提示词权重的安全范围为0.5至1.5。如果某个词组的权重超出这个范围,生成的图像可能会出现扭曲。
至于「负面提示词」,它主要用于指定我们不希望在图像中出现的元素。反向提示词可以为空,但通常,为了标准化图片,我们会选择加入一些常见的词组。
为了更方便地输入提示词,我们推荐使用如下插件:
插件地址:
📚💻🚀 领略未来Web UI设计!🚀💻📚 Physton团队精心打造的【全栈prompt】项目,一键掌握所有需求,简化开发流程。🚀🔍 想要提升用户体验?不再为UI/UX头疼?别找了,这个GitHub宝藏——`sd-webui-prompt-all-in-one`,是你迈向高效设计的捷径!它不仅仅是一个库,更是创新思维与实践的结晶。👩💻👨💻📚 快速浏览源代码,发现隐藏在每个prompt背后的逻辑和灵活性。无论你是前端开发者、UI设计师还是项目经理,这个项目都能满足你的需求,让你的工作如行云流水般顺畅。🛠️🌐 想要提升项目的搜索引擎友好度?别担心,全栈prompt的API设计考虑了SEO最佳实践,助你轻松优化内容,提升流量。🚀💖 为了保护作者权益和促进社区交流,我们已移除直接联系方式。但如果你对项目有任何疑问或建议,欢迎在GitHub上提交 issues 或参与讨论。💡别犹豫了,立即拥抱这个Web UI设计的革命,让你的工作效率翻倍!🚀💪 #全栈prompt #WebUI设计 #开发利器
安装该插件后,你将在提示词页面看到新增的功能。
4、AI 绘图必备提示词工具
许多在线工具可以帮助你编写提示词。例如:
🌟文章写作大师在此!🚀💡探索未来科技与艺术的交汇点,让我带你踏上这场创新之旅!🌍🔍首先,AI.Dawnmark.cn 是你发现最新人工智能动态的不二之选——它就像知识的灯塔,在数据海洋中照亮前行的道路。💡📈CivitaAI,则是驱动城市智慧转型的秘密武器,他们的图像识别技术让你的城市生活更加便捷与高效。📚💻🎨最后,OpenArt.AI 创意无限,艺术与科技无缝融合,每一幅作品都是一次视觉盛宴,带你领略数字艺术的魅力。🖼️🌈别忘了,想要了解更多详情,只需轻轻一点——链接就在文中等你哦!🔗记得关注我,获取更多行业洞察和创意灵感,让我们一起在知识的海洋中遨游!📚🌊#科技与艺术 #人工智能探索 #未来生活体验
这些工具的使用方法非常简单,你只需选择相应的参数和风格,然后复制生成的提示词到SD中。
5、AI 绘图工具:ChatGPT DALL·E 3与 Midjourney比较
在 AI 绘图领域,ChatGPT 的 DALL·E 3 和 Midjourney 无疑是两大巨头。而对于很多用户来说,了解它们之间的不同可能会影响其选择。以下是两者的详细比较。
1. 功能性与易用性:
– ChatGPT 的 DALL·E 3:DALL·E 3 的最大优势在于其与 ChatGPT 的无缝集成。用户只需通过文本聊天框提供指示,即可生成所需的图像。这种自然语言处理方式使得使用起来非常直观和简单,无需复杂的界面和操作。
– Midjourney:虽然 Midjourney 也为用户提供了直观的界面,但其更偏向于专业用户,可能需要更多的学习和适应。
2. 图像质量与创意性:
– ChatGPT 的 DALL·E 3:DALL·E 3 生成的图像细节丰富,能够准确捕捉到用户的意图并将其转化为有趣的图像创意。它的技术使其在理解复杂的描述和生成相应图像方面表现出色。
– Midjourney:Midjourney 在艺术效果和专业质量方面表现出众,更适用于需要高水平审美和专业领域的场景。
3. 适用领域:
– ChatGPT 的 DALL·E 3:由于其易用性和广泛的应用范围,DALL·E 3 更适合日常用户和非专业人士,例如内容创作者、博主和设计爱好者。
– Midjourney:由于其艺术性和专业性,Midjourney 更适合设计师、艺术家和专业团队使用,特别是在需要高质量输出的项目中。
4. 开放性与集成:
– ChatGPT 的 DALL·E 3:由于是 OpenAI 的产品,DALL·E 3 有可能与 OpenAI 的其他产品进行集成,这为未来的发展和扩展提供了更多的可能性。
– Midjourney:作为一个独立的平台,Midjourney 在与其他系统集成时可能需要更多的工作和调整。
总结,选择 ChatGPT 的 DALL·E 3 还是 Midjourney 主要取决于个人或团队的需求。对于那些需要快速、简单的图像生成的人,DALL·E 3 可能是更好的选择。而对于那些追求专业质量和艺术效果的人,Midjourney 可能更具吸引力。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!