策略 C:图像五维解析_
**版本**:v1.1 | **适用**:用户上传图片(绘画/照片/草图/参考图)
策略 C:图像五维解析
Visual Five-Dimension Analysis
版本:v1.1 | 适用:用户上传图片(绘画/照片/草图/参考图)
策略定位
触发信号:
- 用户上传任何图像,无论是绘画作品、照片、草图还是参考图
- 用语:"分析这幅画" / "这是什么风格" / "帮我延伸这个意境"
- 或直接上传图片不说话(默认触发)
核心假设:
图像是最直接的艺术意图表达,但它的意义需要被"翻译"。
策略C将图像中的视觉信息,系统地映射到五维知识框架,既做分析,也做生成指导。
与原VCA/ASA的关系:
策略C整合了原系统中:
- VCA(视觉批评智能体) — 七维技法拆解
- ASA(艺术风格智能体) — 中西双轨风格识别
- SAA(画外音分析智能体) — 精神内核解读
图像类型判断(首先执行)
| 图像类型 | 判断依据 | 主要任务 |
|---|---|---|
| A. 已有绘画作品 | 有明显艺术处理,非照片 | 风格识别 + 画外音解读 |
| B. 照片/摄影参考 | 写实照片感 | 提炼可绘画化元素 |
| C. 草图/线稿 | 有线条但未完成 | 补全意图 + 风格适配 |
| D. 情绪/氛围参考图 | 用户用它表达感觉 | 情绪解码 + 风格推荐 |
| E. AI生成图 | 特征:过于完美/某种AI质感 | 指出AI特征 + 改善方向 |
主处理流程
图像输入
↓
【STEP 1】图像类型判断(A/B/C/D/E)
↓
【STEP 2】视觉基础信息提取
媒介 / 尺寸比例 / 整体调子 / 第一印象
↓
【STEP 3】七维技法拆解(绘画语言层)
按顺序:构图→形体→透视→光影→色彩→笔触→边缘
↓
【STEP 4】风格识别与量化(中西双轨)
主导风格 + 次要影响 + 四轴向量定位
↓
【STEP 5】画外音逆向推断
从可见的视觉特征,反推不可见的精神意图
↓
【STEP 6】五维整合输出
↓
【STEP 7】按用户需求生成后续方案(如需要)
STEP 3:七维技法拆解详细操作
维度1:构图与组织
提取这些信息:
- 视觉重心在哪里?(中央/偏角/多中心/无中心)
- 属于哪种构图类型?(参见绘画语言知识库)
- 视线被引导到哪里?路径是什么?
- 是满构图还是留白构图?留白在哪里?
- 东方散点透视 or 西方焦点透视的构图逻辑?
维度2:形状与造型
提取这些信息:
- 形体是写实的还是被改造的?改造方式是什么?
- 是几何化/意象化/夸张变形/平面化/写实解剖中的哪种?
- 形体边界是清晰的还是模糊的?
- 东方"取神舍形" or 西方解剖结构优先?
维度3:透视与空间
提取这些信息:
- 用的是哪种透视系统?(焦点/散点/平行/心理/象征)
- 空间的深度感强还是弱?
- 前中后景的分层是否清晰?
- 有没有东方散点透视的特征(移动视点/时间展开)?
维度4:光影与明暗
提取这些信息:
- 有没有明确的光源?光源方向?
- 明暗对比度如何?(强/中/弱)
- 光的性质是硬光还是软光?冷光还是暖光?
- 是否有明暗对照法(Tenebrism)?还是无光源的东方墨色体系?
维度5:色彩系统
提取这些信息:
- 整体色温倾向(冷/暖/中性)
- 色彩策略(固有色/情绪色/象征色)
- 主要色相和配色关系
- 饱和度高低
- 是否有东方单色/金碧/浅绛等特殊色彩系统?
维度6:笔触与肌理
提取这些信息:
- 笔触是否可见?可见度高低?
- 是厚涂/薄涂/无笔触/书法性笔触?
- 笔触方向是否统一?有无节奏感?
- 是否有东方书法用笔特征(中锋/侧锋/飞白/皴法)?
维度7:边缘与节奏
提取这些信息:
- 边缘是硬边还是软边?
- 虚实关系是否分明?哪里实哪里虚?
- 整体画面有没有节奏感?是什么样的节奏?
- 是否有东方"意到笔不到"的失边特征?
STEP 4:风格识别与量化
双轨识别流程
第一轮:快速判断
→ 这是东方体系 or 西方体系 or 融合?
→ 根据透视/光影/笔触做初步判断
第二轮:精确匹配
→ 调取 风格-knowledge.md 的快速识别参考
→ 与风格库档案中的四轴向量对比
→ 确定主导风格 + 次要影响
第三轮:量化定位
→ 给出四轴向量值
→ 如有风格档案,与其标准向量对比偏差
风格比重输出格式
主导风格(60%以上):[风格名] — [主要依据]
次要影响(30%左右):[风格名] — [体现在哪里]
痕迹(10%以下):[风格名] — [微弱特征]
四轴向量:
再现 [●位置]○○○○ 表现
结构 ●[位置]○○○ 感知
秩序 ●○[位置]○○ 张力
节制 [●位置]○○○ 强度
STEP 5:画外音逆向推断
从视觉特征推断精神意图:
| 视觉特征 | 可能指向的画外音 |
|---|---|
| 孤立的人物 + 大空白 | V1 存在感知(孤独型) |
| 暖光 + 日常场景 | V1 存在感知(日常诗意型) |
| 扭曲变形的形体 | V2 情绪表达(压抑/焦虑) |
| 高饱和度色彩 + 旋转笔触 | V2 情绪表达(激情/生命力) |
| 具体历史/民族场景 | V3 叙事记忆 |
| 劳动者/社会底层题材 | V4 价值判断(社会批判) |
| 荒诞并置/不可能场景 | V5 感知实验 |
逆推原则:
- 不强加解读,用"可能是"/"倾向于"表达不确定性
- 如果画外音明确,直接给出;如果模糊,给出2-3种可能
- 中国传统绘画的画外音优先参考题材象征体系(梅=傲骨、枯荷=消逝等)
各类型图像的专项处理
A类:已有绘画作品
重点:风格精确识别 + 画外音深度解读
额外任务:
- 如果是历史名作:调取风格库对应档案进行深度解读
- 如果是当代作品:给出创作建议(哪个维度还有提升空间)
- 如果是AI生成:识别AI特征(见下方E类处理)
B类:照片/摄影参考
重点:提取绘画化元素
提取框架:
1. 这张照片的"画面情绪"是什么?(光线、氛围、构图)
2. 哪些元素是可以绘画化的?(主体、背景、细节)
3. 如果要画这张照片,应该:
- 强化哪里?(画眼)
- 简化哪里?(背景和次要元素)
- 改变哪里?(透视、光影的艺术化处理)
4. 推荐绘画化的风格方向(2-3个)
C类:草图/线稿
重点:结构分析 + 补全意图
分析框架:
1. 构图骨架识别:主体位置、空间关系是否合理?
2. 意图推断:作者想画什么?哪些地方还未决定?
3. 补全建议:
- 空间层次如何建立?
- 色彩体系选哪种?
- 适合哪种风格来完成?
4. 给出3种不同完成方向
D类:情绪/氛围参考图
重点:情绪解码,无需精确风格分析
处理方式:
1. 识别图片的情绪密码:色调、光感、空间感
2. 翻译为画外音类型(V1-V5)
3. 给出能产生相似情绪效果的绘画风格推荐
4. 不必精确分析技法,重点在情绪迁移
E类:AI生成图
重点:识别AI特征 + 改善方向
AI生成图常见问题清单:
□ 过度完美:每处细节都同等精细,无主次
□ 材质混乱:不同材质的光反射逻辑混用
□ 物理错误:倒影/阴影/光源方向不一致
□ 文化模糊:混合了多种文化符号,缺乏地域特征
□ 空间矛盾:透视关系不统一
□ 人物问题:手部/面部/姿态的AI特征痕迹
□ 笔触缺失:表面感太光滑,缺乏绘画性
对每个被识别的问题,给出具体改进提示词建议。
输出格式
完整分析模式(默认)
【策略C:图像五维解析】
📸 图像类型:[A/B/C/D/E] [类型说明]
🔍 七维技法拆解:
① 构图与组织:[分析]
② 形状与造型:[分析]
③ 透视与空间:[分析]
④ 光影与明暗:[分析]
⑤ 色彩系统:[分析]
⑥ 笔触与肌理:[分析]
⑦ 边缘与节奏:[分析]
🎨 风格识别:
主导:[风格名]([百分比])— [依据]
次要:[风格名]([百分比])— [依据]
四轴向量:[量化]
🎭 画外音解读:
类型:V[N] [类型名]
精神内核:[2-3句话]
📋 五维整合:
[简洁版五维总结]
💡 延伸方向(如需生成新作品):
[基于分析的创作建议]
快速识别模式(用户问"这是什么风格")
风格:[主导风格] × [次要影响]
四轴:再现[●]表现 / 结构[●]感知 / 秩序[●]张力 / 节制[●]强度
画外音:V[N] [类型] — [一句话]
一句话总结:[最精准的描述]