CLIP Interrogator
AI提示词工具
CLIP Interrogator

图像转提示词工具,核心是通过 CLIP 与 BLIP/GIT 多模态模型协同,对输入图像做视觉解析,自动生成可直接用于 Stable Diffusion 等文生图模型的高精度正向 / 负向提示词,并精准还原风格、艺术家、光影与构图,是 “风格迁移、反向工程、批量出图” 的核心生产力工具。

CLIP Interrogator 是由 pharmapsychotic 开发的图像转提示词工具,核心是通过 CLIP 与 BLIP/GIT 多模态模型协同,对输入图像做视觉解析,自动生成可直接用于 Stable Diffusion 等文生图模型的高精度正向 / 负向提示词,并精准还原风格、艺术家、光影与构图,是 “风格迁移、反向工程、批量出图” 的核心生产力工具。

一、核心特点

  • 多模型协同解析:BLIP/GIT 生成基础描述,CLIP 做特征匹配,补全风格、艺术家、流派等关键标签。
  • 四种生成模式:best(全面精准)、fast(快速基础)、classic(经典算法)、negative(生成负面提示词)。
  • SD 深度适配:生成结果针对 Stable Diffusion 优化,可直接复用采样步数、分辨率等参数。
  • 自定义配置灵活:支持切换 CLIP 模型(如 ViT-L-14/openai)、调整批处理大小、设置缓存路径。
  • 多端可用:提供 Hugging Face Web Demo、本地 Python 部署、第三方插件(如 Automatic1111)。
  • 风格还原能力强:擅长识别艺术流派、画师风格、光影类型、材质质感,远超普通打标工具。

二、主要优点

  1. 精准反向工程:输入参考图,自动提取 “内容 + 风格 + 技法” 的完整提示词,大幅降低复刻成本。
  2. 负面词自动生成:一键识别并生成需排除的元素(如杂色、模糊、多余物体),提升出图质量。
  3. 专业标签库丰富:内置艺术家、风格、材质等专业词汇,生成的提示词更符合 AI 绘画逻辑。
  4. 开源可扩展:支持自定义词汇表,适配特定领域(如 UI 设计、产品渲染)的标签需求。
  5. 无缝接入工作流:本地部署可批量处理,Web Demo 零门槛试用,插件版直接嵌入 SD 界面。

三、主要缺点

  1. 速度与算力挂钩:best 模式耗时较长,低配置显卡可能出现内存不足。
  2. 对抽象风格有限:极端抽象艺术、小众风格的识别准确率可能下降。
  3. 非可视化构建:仅输出文本提示词,无法拖拽调整权重或模块。
  4. 需手动微调:生成结果可能包含冗余标签,需结合场景删减优化。
  5. 无中文界面:Web 与本地版均为英文,中文关键词支持较弱。

四、使用场景

  • UI/UX 设计师:参考优秀设计图,快速生成同风格的插画、图标、场景图提示词。
  • 风格迁移创作:将照片、手绘稿转为特定艺术风格(如赛博朋克、水墨、像素)的提示词。
  • 批量出图标准化:对系列化需求,提取基准图提示词,修改主体后批量生成。
  • 提示词学习:通过 “图像→提示词” 的对应关系,学习专业提示词的结构与关键词搭配。
  • 模型训练辅助:为 LoRA/DreamBooth 训练生成精准的图像标签,提升训练效果。

五、实际应用

  • 设计风格复刻:上传一张极简主义 UI 插画,生成包含 “minimalist UI illustration, flat design, soft pastels, vector art” 的提示词,用于 SD 批量生成同类素材。
  • 照片转艺术画:输入街景照片,生成 “cyberpunk cityscape, neon lights, rain-soaked streets, cinematic lighting, style of Blade Runner” 的提示词。
  • 负面词优化:识别出图像中的 “text, watermark, blurry, low resolution”,自动生成负面提示词,排除瑕疵。
  • 批量标签生成:为 100 张产品图批量生成精准标签,用于训练产品外观 LoRA 模型。

六、使用流程

方式一:Web Demo(零门槛)
  1. 打开 Hugging Face CLIP Interrogator Web Demo。
  2. 上传图像,选择生成模式(如 best)。
  3. 等待生成,复制正向 / 负向提示词。
  4. 粘贴到 Stable Diffusion 生成图像,按需微调。
方式二:本地部署(批量高效)
  1. 克隆仓库:git clone https://github.com/pharmapsychotic/clip-interrogator.git
  2. 安装依赖:pip install -r requirements.txt
  3. 编写脚本(示例):
    python
    运行
    from PIL import Image
    from clip_interrogator import Config, Interrogator
    
    config = Config(clip_model_name="ViT-L-14/openai")
    ci = Interrogator(config)
    image = Image.open("reference.jpg").convert("RGB")
    prompt = ci.interrogate(image)  # 正向提示词
    negative_prompt = ci.interrogate_negative(image)  # 负面提示词
    print("Prompt:", prompt)
    print("Negative Prompt:", negative_prompt)
    
  4. 运行脚本,获取提示词。

七、官方与资源

相关导航

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注