2.1 基础必填元素
描述性文本提示(prompt)是用于指导DALL·E 3生成图像的详细、具体的文本说明,是提示词中的必填元素。描述性文本提示依赖于连贯的自然语言描述,通常是自由形式的,不受特定格式或规则的限制,可以包括场景描述、情绪、颜色、光影效果等丰富的细节,允许创造力和想象力的广泛表达。描述性文本提示越清晰、详细,DALL·E 3越能准确理解并实现用户想要的图像内容。
▲ 提示词:一个身穿闪亮银色盔甲的骑士,在一片茂密的绿色森林中与一只巨大的火龙战斗。骑士手持长矛,盔甲上刻有复杂的纹饰。龙呈现出深红色的鳞片,正在喷射火焰。周围的树木高大而古老,阳光透过树梢洒下,创造出戏剧性的光影效果。
提示
以上是一个典型的用丰富的自然语言写出来的描述性提示词。也就是说,不需要在意结构,想到哪写到哪,只要描述得足够详细,DALL·E 3生成的图像就足够符合语意。
DALL·E 3的提示词除了可以使用灵活的自然语言进行描述以外,还可以按照一定的结构进行构建,一般由媒介、主题和场景三个部分共同构成。
(1)媒介——通常指艺术创作中使用的技术或材料。在DALL·E 3的提示词中,可以指定图像应模仿的艺术风格或技术手段作为图像的媒介,比如油画、水彩画、铅笔画、数字艺术、摄影、雕塑等视觉艺术形式,或是特定的艺术时期或风格。
(2)主题——图像中的主要内容或焦点。主题可以是具体的物体、人物、动物或任何特定的概念,例如自然景观、建筑物、日常物品、人物、动物、神话生物,或某种情感、概念等抽象主题。
(3)场景——图像的背景和环境,它为主题提供了上下文。场景可以是物理环境,如森林、城市、室内空间;时间背景,如历史时期、未来、特定的季节或时间(日出、夜晚等);情境或情感背景,如梦境、超现实场景、平静或紧张的氛围。
在创建DALL·E 3的提示词时,按照一定的结构组织而成的自然语言样式,可以让DALL·E 3准确地理解和执行,生成符合期望的结果。
例如,输入一个结构完整的提示词“中世纪城堡的水彩画,背景是春季的乡村景观”,DALL·E 3就可以生成一幅描绘春季乡村中世纪城堡的水彩画风格的图像。如果不注明是由DALL·E 3生成的,恐怕专业人士也会认为这幅画出自人类水彩画家之手。
▲ 提示词:中世纪城堡的水彩画,背景是春季的乡村景观。
提示
这是一段按照一定结构组织而成的提示词,其中“中世纪城堡”是主题,“水彩画”是媒介,“背景是春季的乡村景观”是场景。
无论是用丰富的自然语言进行描述的提示词,还是按照一定结构组织而成的提示词,都可以引导DALL·E 3生成高质量的图像。在实际使用中,也可以结合两者的优点,创造出既丰富又具有一定结构的提示词,以实现最佳的图像生成效果。