Qwen-Image太香了,号称开源版即梦3.0,可以生中文可改图,支持中文提示词
Qwen-Image太香了,号称开源版即梦3.0,可以生中文可改图,支持中文提示词
这是直接的GGUF转换Qwen/Qwen-Image.
模型文件可以用于ComfyUI中的ComfyUI-GGUF自定义节点。将所需的模型放入以下文件夹中:
类型 | 名字 | 位置 | 下载 |
---|---|---|---|
主要模型 | Qwen-图像 | ComfyUI/models/diffusion_models | GGUF(这个仓库) |
文本编码器 | Qwen2.5-VL-7B | ComfyUI/models/text_encoders | 安全张量 / GGUF |
变分自编码器 | Qwen-图像 VAE | ComfyUI/models/vae | 安全张量 |
示例输出 - 样本量为1,不完全具有代表性
Q5_K_M、Q4_K_M以及最重要的是低比特率量化(Q3_K_M、Q3_K_S、Q2_K)使用了一种新的动态逻辑,其中第一/最后一层保持高精度。
为了比较,请参见这个imgsli页面。使用这种方法,即使Q2_K仍然可以部分使用。
由于这是一个量化模型而不是微调模型,所有相同限制/原始许可条款仍然适用。
Qwen-Image 的主要特性包括:
•文本渲染能力:Qwen-Image 在复杂文本渲染方面表现出色,支持多行布局、段落级文本生成以及细粒度细节呈现。无论是英语还是中文,均能实现高保真输出。
•一致性的图像编辑能力:通过增强的多任务训练范式,Qwen-Image 在编辑过程中能保持编辑的一致性。
•跨基准性能表现:在多个公开基准测试中的评估表明,Qwen-Image 在各类生成与编辑任务中均获得 SOTA。
通义千问团队在多个公开基准上对 Qwen-Image 进行了全面评估,包括用于通用图像生成的 GenEval、DPG 和 OneIG-Bench,以及用于图像编辑的 GEdit、ImgEdit 和 GSO。
Qwen-Image 在所有基准测试中均取得了最先进的性能。此外,在用于文本渲染的 LongText-Bench、ChineseWord 和 TextCraft 上的结果表明,Qwen-Image 在文本渲染方面表现尤为出色,特别是在中文文本渲染上,大幅领先现有的最先进模型。
Qwen-Image太香了,号称开源版即梦3.0,可以生中文可改图,支持中文提示词
这是直接的GGUF转换Qwen/Qwen-Image.
模型文件可以用于ComfyUI中的ComfyUI-GGUF自定义节点。将所需的模型放入以下文件夹中:
类型 | 名字 | 位置 | 下载 |
---|---|---|---|
主要模型 | Qwen-图像 | ComfyUI/models/diffusion_models | GGUF(这个仓库) |
文本编码器 | Qwen2.5-VL-7B | ComfyUI/models/text_encoders | 安全张量 / GGUF |
变分自编码器 | Qwen-图像 VAE | ComfyUI/models/vae | 安全张量 |
示例输出 - 样本量为1,不完全具有代表性
Q5_K_M、Q4_K_M以及最重要的是低比特率量化(Q3_K_M、Q3_K_S、Q2_K)使用了一种新的动态逻辑,其中第一/最后一层保持高精度。
为了比较,请参见这个imgsli页面。使用这种方法,即使Q2_K仍然可以部分使用。
由于这是一个量化模型而不是微调模型,所有相同限制/原始许可条款仍然适用。
Qwen-Image 的主要特性包括:
•文本渲染能力:Qwen-Image 在复杂文本渲染方面表现出色,支持多行布局、段落级文本生成以及细粒度细节呈现。无论是英语还是中文,均能实现高保真输出。
•一致性的图像编辑能力:通过增强的多任务训练范式,Qwen-Image 在编辑过程中能保持编辑的一致性。
•跨基准性能表现:在多个公开基准测试中的评估表明,Qwen-Image 在各类生成与编辑任务中均获得 SOTA。
通义千问团队在多个公开基准上对 Qwen-Image 进行了全面评估,包括用于通用图像生成的 GenEval、DPG 和 OneIG-Bench,以及用于图像编辑的 GEdit、ImgEdit 和 GSO。
Qwen-Image 在所有基准测试中均取得了最先进的性能。此外,在用于文本渲染的 LongText-Bench、ChineseWord 和 TextCraft 上的结果表明,Qwen-Image 在文本渲染方面表现尤为出色,特别是在中文文本渲染上,大幅领先现有的最先进模型。