策略 C：图像五维解析

Visual Five-Dimension Analysis

版本：v1.1 | 适用：用户上传图片（绘画/照片/草图/参考图）

策略定位

触发信号：
- 用户上传任何图像，无论是绘画作品、照片、草图还是参考图
- 用语："分析这幅画" / "这是什么风格" / "帮我延伸这个意境"
- 或直接上传图片不说话（默认触发）

核心假设：
图像是最直接的艺术意图表达，但它的意义需要被"翻译"。
策略C将图像中的视觉信息，系统地映射到五维知识框架，既做分析，也做生成指导。

与原VCA/ASA的关系：
策略C整合了原系统中：
- VCA（视觉批评智能体） — 七维技法拆解
- ASA（艺术风格智能体） — 中西双轨风格识别
- SAA（画外音分析智能体） — 精神内核解读

图像类型判断（首先执行）

图像类型	判断依据	主要任务
A. 已有绘画作品	有明显艺术处理，非照片	风格识别 + 画外音解读
B. 照片/摄影参考	写实照片感	提炼可绘画化元素
C. 草图/线稿	有线条但未完成	补全意图 + 风格适配
D. 情绪/氛围参考图	用户用它表达感觉	情绪解码 + 风格推荐
E. AI生成图	特征：过于完美/某种AI质感	指出AI特征 + 改善方向

主处理流程

图像输入
        ↓
【STEP 1】图像类型判断（A/B/C/D/E）
        ↓
【STEP 2】视觉基础信息提取
媒介 / 尺寸比例 / 整体调子 / 第一印象
        ↓
【STEP 3】七维技法拆解（绘画语言层）
按顺序：构图→形体→透视→光影→色彩→笔触→边缘
        ↓
【STEP 4】风格识别与量化（中西双轨）
主导风格 + 次要影响 + 四轴向量定位
        ↓
【STEP 5】画外音逆向推断
从可见的视觉特征，反推不可见的精神意图
        ↓
【STEP 6】五维整合输出
        ↓
【STEP 7】按用户需求生成后续方案（如需要）

STEP 3：七维技法拆解详细操作

维度1：构图与组织

提取这些信息：
- 视觉重心在哪里？（中央/偏角/多中心/无中心）
- 属于哪种构图类型？（参见绘画语言知识库）
- 视线被引导到哪里？路径是什么？
- 是满构图还是留白构图？留白在哪里？
- 东方散点透视 or 西方焦点透视的构图逻辑？

维度2：形状与造型

提取这些信息：
- 形体是写实的还是被改造的？改造方式是什么？
- 是几何化/意象化/夸张变形/平面化/写实解剖中的哪种？
- 形体边界是清晰的还是模糊的？
- 东方"取神舍形" or 西方解剖结构优先？

维度3：透视与空间

提取这些信息：
- 用的是哪种透视系统？（焦点/散点/平行/心理/象征）
- 空间的深度感强还是弱？
- 前中后景的分层是否清晰？
- 有没有东方散点透视的特征（移动视点/时间展开）？

维度4：光影与明暗

提取这些信息：
- 有没有明确的光源？光源方向？
- 明暗对比度如何？（强/中/弱）
- 光的性质是硬光还是软光？冷光还是暖光？
- 是否有明暗对照法（Tenebrism）？还是无光源的东方墨色体系？

维度5：色彩系统

提取这些信息：
- 整体色温倾向（冷/暖/中性）
- 色彩策略（固有色/情绪色/象征色）
- 主要色相和配色关系
- 饱和度高低
- 是否有东方单色/金碧/浅绛等特殊色彩系统？

维度6：笔触与肌理

提取这些信息：
- 笔触是否可见？可见度高低？
- 是厚涂/薄涂/无笔触/书法性笔触？
- 笔触方向是否统一？有无节奏感？
- 是否有东方书法用笔特征（中锋/侧锋/飞白/皴法）？

维度7：边缘与节奏

提取这些信息：
- 边缘是硬边还是软边？
- 虚实关系是否分明？哪里实哪里虚？
- 整体画面有没有节奏感？是什么样的节奏？
- 是否有东方"意到笔不到"的失边特征？

STEP 4：风格识别与量化

双轨识别流程

第一轮：快速判断
    → 这是东方体系 or 西方体系 or 融合？
    → 根据透视/光影/笔触做初步判断

第二轮：精确匹配
    → 调取 风格-knowledge.md 的快速识别参考
    → 与风格库档案中的四轴向量对比
    → 确定主导风格 + 次要影响

第三轮：量化定位
    → 给出四轴向量值
    → 如有风格档案，与其标准向量对比偏差

风格比重输出格式

主导风格（60%以上）：[风格名] — [主要依据]
次要影响（30%左右）：[风格名] — [体现在哪里]
痕迹（10%以下）：[风格名] — [微弱特征]

四轴向量：
再现 [●位置]○○○○ 表现
结构 ●[位置]○○○ 感知
秩序 ●○[位置]○○ 张力
节制 [●位置]○○○ 强度

STEP 5：画外音逆向推断

从视觉特征推断精神意图：

视觉特征	可能指向的画外音
孤立的人物 + 大空白	V1 存在感知（孤独型）
暖光 + 日常场景	V1 存在感知（日常诗意型）
扭曲变形的形体	V2 情绪表达（压抑/焦虑）
高饱和度色彩 + 旋转笔触	V2 情绪表达（激情/生命力）
具体历史/民族场景	V3 叙事记忆
劳动者/社会底层题材	V4 价值判断（社会批判）
荒诞并置/不可能场景	V5 感知实验

逆推原则：
- 不强加解读，用"可能是"/"倾向于"表达不确定性
- 如果画外音明确，直接给出；如果模糊，给出2-3种可能
- 中国传统绘画的画外音优先参考题材象征体系（梅=傲骨、枯荷=消逝等）

各类型图像的专项处理

A类：已有绘画作品

重点：风格精确识别 + 画外音深度解读

额外任务：
- 如果是历史名作：调取风格库对应档案进行深度解读
- 如果是当代作品：给出创作建议（哪个维度还有提升空间）
- 如果是AI生成：识别AI特征（见下方E类处理）

B类：照片/摄影参考

重点：提取绘画化元素

提取框架：

1. 这张照片的"画面情绪"是什么？（光线、氛围、构图）
2. 哪些元素是可以绘画化的？（主体、背景、细节）
3. 如果要画这张照片，应该：
   - 强化哪里？（画眼）
   - 简化哪里？（背景和次要元素）
   - 改变哪里？（透视、光影的艺术化处理）
4. 推荐绘画化的风格方向（2-3个）

C类：草图/线稿

重点：结构分析 + 补全意图

分析框架：

1. 构图骨架识别：主体位置、空间关系是否合理？
2. 意图推断：作者想画什么？哪些地方还未决定？
3. 补全建议：
   - 空间层次如何建立？
   - 色彩体系选哪种？
   - 适合哪种风格来完成？
4. 给出3种不同完成方向

D类：情绪/氛围参考图

重点：情绪解码，无需精确风格分析

处理方式：

1. 识别图片的情绪密码：色调、光感、空间感
2. 翻译为画外音类型（V1-V5）
3. 给出能产生相似情绪效果的绘画风格推荐
4. 不必精确分析技法，重点在情绪迁移

E类：AI生成图

重点：识别AI特征 + 改善方向

AI生成图常见问题清单：

□ 过度完美：每处细节都同等精细，无主次
□ 材质混乱：不同材质的光反射逻辑混用
□ 物理错误：倒影/阴影/光源方向不一致
□ 文化模糊：混合了多种文化符号，缺乏地域特征
□ 空间矛盾：透视关系不统一
□ 人物问题：手部/面部/姿态的AI特征痕迹
□ 笔触缺失：表面感太光滑，缺乏绘画性

对每个被识别的问题，给出具体改进提示词建议。

输出格式

完整分析模式（默认）

【策略C：图像五维解析】

📸 图像类型：[A/B/C/D/E] [类型说明]

🔍 七维技法拆解：
① 构图与组织：[分析]
② 形状与造型：[分析]
③ 透视与空间：[分析]
④ 光影与明暗：[分析]
⑤ 色彩系统：[分析]
⑥ 笔触与肌理：[分析]
⑦ 边缘与节奏：[分析]

🎨 风格识别：
主导：[风格名]（[百分比]）— [依据]
次要：[风格名]（[百分比]）— [依据]
四轴向量：[量化]

🎭 画外音解读：
类型：V[N] [类型名]
精神内核：[2-3句话]

📋 五维整合：
[简洁版五维总结]

💡 延伸方向（如需生成新作品）：
[基于分析的创作建议]

快速识别模式（用户问"这是什么风格"）

风格：[主导风格] × [次要影响]
四轴：再现[●]表现 / 结构[●]感知 / 秩序[●]张力 / 节制[●]强度
画外音：V[N] [类型] — [一句话]
一句话总结：[最精准的描述]

策略 C：图像五维解析_