AI工具平台 为你提供最新AI工具及常用办公，图片处理，音视频处理，文件转换，英语学习，等一站式工具

AI提示词工具

CLIP Interrogator

图像转提示词工具，核心是通过 CLIP 与 BLIP/GIT 多模态模型协同，对输入图像做视觉解析，自动生成可直接用于 Stable Diffusion 等文生图模型的高精度正向 / 负向提示词，并精准还原风格、艺术家、光影与构图，是 “风格迁移、反向工程、批量出图” 的核心生产力工具。

链接直达手机查看

CLIP Interrogator 是由 pharmapsychotic 开发的图像转提示词工具，核心是通过 CLIP 与 BLIP/GIT 多模态模型协同，对输入图像做视觉解析，自动生成可直接用于 Stable Diffusion 等文生图模型的高精度正向 / 负向提示词，并精准还原风格、艺术家、光影与构图，是 “风格迁移、反向工程、批量出图” 的核心生产力工具。

一、核心特点

多模型协同解析：BLIP/GIT 生成基础描述，CLIP 做特征匹配，补全风格、艺术家、流派等关键标签。
四种生成模式：best（全面精准）、fast（快速基础）、classic（经典算法）、negative（生成负面提示词）。
SD 深度适配：生成结果针对 Stable Diffusion 优化，可直接复用采样步数、分辨率等参数。
自定义配置灵活：支持切换 CLIP 模型（如 ViT-L-14/openai）、调整批处理大小、设置缓存路径。
多端可用：提供 Hugging Face Web Demo、本地 Python 部署、第三方插件（如 Automatic1111）。
风格还原能力强：擅长识别艺术流派、画师风格、光影类型、材质质感，远超普通打标工具。

二、主要优点

精准反向工程：输入参考图，自动提取 “内容 + 风格 + 技法” 的完整提示词，大幅降低复刻成本。
负面词自动生成：一键识别并生成需排除的元素（如杂色、模糊、多余物体），提升出图质量。
专业标签库丰富：内置艺术家、风格、材质等专业词汇，生成的提示词更符合 AI 绘画逻辑。
开源可扩展：支持自定义词汇表，适配特定领域（如 UI 设计、产品渲染）的标签需求。
无缝接入工作流：本地部署可批量处理，Web Demo 零门槛试用，插件版直接嵌入 SD 界面。

三、主要缺点

速度与算力挂钩：best 模式耗时较长，低配置显卡可能出现内存不足。
对抽象风格有限：极端抽象艺术、小众风格的识别准确率可能下降。
非可视化构建：仅输出文本提示词，无法拖拽调整权重或模块。
需手动微调：生成结果可能包含冗余标签，需结合场景删减优化。
无中文界面：Web 与本地版均为英文，中文关键词支持较弱。

四、使用场景

UI/UX 设计师：参考优秀设计图，快速生成同风格的插画、图标、场景图提示词。
风格迁移创作：将照片、手绘稿转为特定艺术风格（如赛博朋克、水墨、像素）的提示词。
批量出图标准化：对系列化需求，提取基准图提示词，修改主体后批量生成。
提示词学习：通过 “图像→提示词” 的对应关系，学习专业提示词的结构与关键词搭配。
模型训练辅助：为 LoRA/DreamBooth 训练生成精准的图像标签，提升训练效果。

五、实际应用

设计风格复刻：上传一张极简主义 UI 插画，生成包含 “minimalist UI illustration, flat design, soft pastels, vector art” 的提示词，用于 SD 批量生成同类素材。
照片转艺术画：输入街景照片，生成 “cyberpunk cityscape, neon lights, rain-soaked streets, cinematic lighting, style of Blade Runner” 的提示词。
负面词优化：识别出图像中的 “text, watermark, blurry, low resolution”，自动生成负面提示词，排除瑕疵。
批量标签生成：为 100 张产品图批量生成精准标签，用于训练产品外观 LoRA 模型。

六、使用流程

方式一：Web Demo（零门槛）

打开 Hugging Face CLIP Interrogator Web Demo。
上传图像，选择生成模式（如 best）。
等待生成，复制正向 / 负向提示词。
粘贴到 Stable Diffusion 生成图像，按需微调。

方式二：本地部署（批量高效）

克隆仓库：git clone https://github.com/pharmapsychotic/clip-interrogator.git。
安装依赖：pip install -r requirements.txt。

编写脚本（示例）：

python

运行

from PIL import Image
from clip_interrogator import Config, Interrogator

config = Config(clip_model_name="ViT-L-14/openai")
ci = Interrogator(config)
image = Image.open("reference.jpg").convert("RGB")
prompt = ci.interrogate(image)  # 正向提示词
negative_prompt = ci.interrogate_negative(image)  # 负面提示词
print("Prompt:", prompt)
print("Negative Prompt:", negative_prompt)