生图模型
1.生图模型简介
平台提供的生图模型主要有以下两种使用方式:一种是根据prompt输入直接生成图像;一种是根据现有图像,加上prompt输入,生成图像变体。
-
根据文本提示创建图像
在使用文生图的大模型时,为了生成更高质量的图像,输入的prompt(提示词)需要精心设计。以下是一些有助于提高生成图像质量的提示词输入技巧:
-
具体描述:尽量详细地描述你想要生成的图像内容。比如,如果你想生成一幅日落的海滩风景,不要仅仅输入“海滩日落”,而是可以尝试输入“一个宁静的海滩上,夕阳西下,天空呈现出橙红色,海浪轻轻拍打着沙滩,远处有一艘小船”。
-
情感和氛围:除了描述图像的内容,还可以加入对情感或氛围的描述,比如“温馨的”、“神秘的”、“充满活力的”等,这样可以帮助模型更好地理解你想要的风格。
-
风格指定:如果你有特定的艺术风格偏好,比如“印象派”、“超现实主义”等,可以在prompt中明确指出,这样生成的图像更有可能符合你的期待。
-
避免模糊不清的词汇:尽量避免使用过于抽象或模糊不清的词汇,比如“美”、“好”等,这些词汇对于模型来说难以具体化,可能会导致生成的图像与预期相差较大。
-
使用否定词:如果你不希望图像中出现某些元素,可以使用否定词来排除。例如,“生成一幅海滩日落的图片,但不要有船”。
-
分步骤输入:对于复杂场景,可以尝试分步骤输入提示词,先生成基础图像,再根据需要调整或添加细节。
-
尝试不同的描述方式:有时候,即使描述的是同一个场景,不同的描述方式也会得到不同的结果。可以尝试从不同的角度或使用不同的词汇来描述,看看哪种方式能得到更满意的结果。
-
利用模型的特定功能:一些模型可能提供了特定的功能或参数调整选项,比如调整生成图像的分辨率、风格强度等,合理利用这些功能也可以帮助提高生成图像的质量。
-
通过上述方法,可以有效地提高使用文生图大模型时生成图像的质量。不过,由于不同的模型可能有不同的特点和偏好,实际操作中可能还需要根据具体模型的特性和反馈进行适当的调整。
可以参考如下示例:
A futuristic eco-friendly skyscraper in central Tokyo. The building incorporates lush vertical gardens on every floor, with cascading plants and trees lining glass terraces. Solar panels and wind turbines are integrated into the structure’s design, reflecting a sustainable future. The Tokyo Tower is visible in the background, contrasting the modern eco-architecture with traditional city landmarks.
An elegant snow leopard perched on a cliff in the Himalayan mountains, surrounded by swirling snow. The animal’s fur is intricately detailed with distinctive patterns and a thick winter coat. The scene captures the majesty and isolation of the leopard’s habitat, with mist and mountain peaks fading into the background.
- 根据现有图像,生成图像变体
有部分生图模型支持通过已有图像生成图像变体,这种情况下,仍然需要输入适当的prompt,才能达到预期的效果,具体prompt输入,可以参考上面内容。
2.体验地址
可以通过 图像生成 体验生图的功能,也可以通过 API文档 介绍,通过API进行调用。
-
重点参数介绍
-
image_size:控制参数的图像分辨率,API请求时候,可以自定义多种分辨率。
-
num_inference_steps:控制图像生成的步长,有部分模型可以通过调整步长,获取生成效果更好的图像,其中模型black-forest-labs/FLUX.1-schnell、Pro/black-forest-labs/FLUX.1-schnell和stabilityai/stable-diffusion-3-5-large-turbo不支持调整步长,默认的步长是4。
-
prompt_enhancement:prompt增强开关,该开关打开后,会对输入的prompt进行一些增强,对于中文用户,想要快速通过中文生成图像,可以打开该开关,更好的适配中文。
-
batch_size:一次生成图像的个数,默认值是1,最大值可以设置为4
-
negative_prompt:这里可以输入图像中不想出现的某些元素,消除一些影响影响因素。
-
seed:如果想要每次都生成固定的图片,可以把seed设置为固定值。
-
3.生图计费介绍
平台的生图计费分为两种计费方式:
-
根据图像大小及图像步长进行计费,单价是 ¥x/M px/Steps,即每M像素每步长是x元。
比如想要生成一个
宽1024*高512
、4步长的图像,选择单价是¥0.0032/M px/Steps
的stabilityai/stable-diffusion-3-5-large-turbo模型,那么生成一张图片的价格就是(1024x512)/(1024x1024)x4x0.0032=0.0064元
,其中2代表宽1024*高512
像素的大小是0.5M,生成一张图像的价格跟生成图像的像素大小和价格都有关系。 -
根据图片张数进行计费,单价是
¥x/Image
,即每张图片的价格是x元。比如想要生成一个
宽1024*高512
像素,4步长的图像,选择单价是¥0.37/Image
的black-forest-labs/FLUX.1-pro模型,那么生成一张图片的价格就是0.37元
,生成一张图像的价格,跟像素和步长都无关。
4.支持模型列表
目前已支持的生图模型:
- 文生图系列:
-
black-forest-labs系列:
- black-forest-labs/FLUX.1-dev
- black-forest-labs/FLUX.1-schnell
- Pro/black-forest-labs/FLUX.1-schnell
- black-forest-labs/FLUX.1-pro
-
stabilityai系列:
- stabilityai/stable-diffusion-3-5-large
- stabilityai/stable-diffusion-3-5-large-turbo
- stabilityai/stable-diffusion-3-medium
- stabilityai/stable-diffusion-xl-base-1.0
- stabilityai/stable-diffusion-2-1
-
- 图生图系列:
- stabilityai系列:
- stabilityai/stable-diffusion-xl-base-1.0
- stabilityai/stable-diffusion-2-1
- stabilityai系列: