策略 A:语义扩散推理_
**版本**:v1.1 | **适用**:用户输入1-5个关键词或短语
策略 A:语义扩散推理
Semantic Diffusion Inference
版本:v1.1 | 适用:用户输入1-5个关键词或短语
策略定位
触发信号:
- 用户输入1到5个词,没有完整的情绪/场景/目的描述
- 词与词之间是并列的,不构成完整意图
- 示例:"孤独的城市" / "梅花傲雪" / "雨后街道" / "宁静的力量"
核心假设:
碎片化的词语是用户艺术意图的种子。策略A的任务是从这颗种子出发,用五维知识体系做有方向性的扩散,生长出一棵完整的创作方案。
处理流程
用户碎片关键词
↓
【STEP 1】多维归类
每个词识别它属于五维中的哪一维,可以归属多个维度
↓
【STEP 2】维度完整性扫描
检查五维中哪些维度已有信息、哪些是空白
↓
【STEP 3】扩散推理(从已知→未知)
从有信息的维度,向空白维度扩散推理,遵循优先级规则
↓
【STEP 4】最小完整假设
用最保守的推断补全缺失维度,不臆造用户意图
↓
【STEP 5】差异化方案生成
单词输入→输出3种不同方向;多词输入→输出1-2种方向
↓
【STEP 6】输出五维分析卡 + 提示词
STEP 1:多维归类规则
每个关键词可以归属于五维中的一个或多个维度:
| 词语性质 | 所属维度 | 典型示例 |
|---|---|---|
| 情绪词 / 感受词 | 画外音 → 世界观 | 孤独、压抑、宁静、炽烈 |
| 自然物 / 具体事物 | 主题 → 画外音 | 梅花、废墟、大海、街道 |
| 风格流派词 | 风格 → 世界观 | 印象派、水墨、表现主义 |
| 哲学 / 思想词 | 世界观 → 画外音 | 虚无、轮回、消逝、永恒 |
| 技法 / 材料词 | 绘画语言 → 风格 | 厚涂、留白、散点透视 |
| 时间 / 天气词 | 主题修饰 + 画外音 | 黄昏、雨后、初雪 |
| 地点 / 地域词 | 主题 → 中国性验证 | 江南、京都、纽约、戈壁 |
STEP 3:扩散推理优先级
从不同起点维度出发,推理方向有固定优先级:
从画外音出发(词语是情绪/感受)
画外音已知
↓ 推断与之匹配的世界观(东方/西方/在场者/观察者)
↓ 世界观 → 推断2-3个候选风格
↓ 风格 → 匹配适合表达该情绪的主题题材
↓ 主题 + 风格 → 生成绘画语言七维参数
从主题出发(词语是具体事物/场景)
主题题材已知
↓ 题材有没有固有的画外音倾向?(梅花→傲骨;废墟→消逝或批判)
↓ 上推最可能的画外音类型(V1-V5)
↓ 画外音 → 世界观 → 风格
↓ 生成绘画语言参数
从风格出发(词语是流派/风格词)
风格已知
↓ 调取 风格库/对应档案.md,读取该风格的世界观和画外音
↓ 反向确认:用户想要的是这种风格的全部基因,还是只借用某个维度?
↓ 确认后:以风格为锚点,补全其他维度
↓ 生成七维绘画语言参数
从绘画语言出发(词语是技法词)
绘画语言已知
↓ 反推:这种技法通常属于哪些风格体系?
↓ 列出2-3个候选风格
↓ 每个风格对应的世界观和画外音是什么?
↓ 让用户确认方向,或按最常见的搭配生成
STEP 4:最小完整假设原则
当某个维度无法从已知词语推断时,使用以下默认假设:
| 空白维度 | 最小假设 |
|---|---|
| 画外音 | 不设定,保持开放,让风格和主题决定 |
| 世界观 | 按题材的文化归属决定(中国题材→东方在场者;西方题材→观察者) |
| 风格 | 匹配题材最常见、画外音最匹配的风格 |
| 主题 | 从画外音和风格反推最合适的载体题材 |
| 绘画语言 | 直接从风格档案的"绘画语言偏好"中调取 |
禁止的假设:
- 不臆造用户没有提到的文化背景
- 不自动添加"中国风"(除非词语本身指向)
- 不把单个情绪词扩展成复杂叙事
STEP 5:方案数量规则
| 输入情况 | 方案数量 | 理由 |
|---|---|---|
| 单个词语 | 3个差异化方向 | 单词语义太宽,用户需要选择 |
| 2-3个词(同方向) | 1-2个方向 | 词语收窄了意图范围 |
| 2-3个词(矛盾/张力) | 2个方向(分别忠于两个极端) | 矛盾保留是高质量画外音 |
| 4-5个词(完整描述倾向) | 1个方向 + 可选变体 | 已接近策略E范畴 |
特殊情况处理
矛盾词组(高质量画外音信号)
示例:"热烈的冷漠" / "安静的混乱" / "甜蜜的悲伤"
处理方式:
1. 保留矛盾,不化解——这种张力本身就是画外音的精髓
2. 找能承载张力的风格:表现主义、超现实主义、当代具象
3. 在画外音层标注:V2情绪表达(矛盾型)
4. 绘画语言层也设计对立:如暖色调 + 冷漠笔触
多语言词混合
示例:"melancholy 水墨"
处理方式:
1. melancholy → 画外音:V1存在感知(忧郁型)
2. 水墨 → 绘画语言:东方水墨体系
3. 识别张力:西方情绪概念 + 东方表达媒介
4. 走中西融合路径(策略库/中西融合路径.md)
输出格式
【策略A:语义扩散 — 方案[N]】
🌱 种子词解析:
"[词1]" → [归属维度]:[解读]
"[词2]" → [归属维度]:[解读]
🔁 扩散路径:
[维度A] → [维度B] → [维度C] → [维度D] → [维度E]
📋 五维方案:
画外音:V[N] [类型] — [1-2句话]
世界观:象限[N] — [1句话]
风格:[主导风格] × [次要影响](四轴向量:再现●○○○○表现)
主题:[题材类别] → [具体题材]
绘画语言:
①构图: ②形体: ③透视: ④光影:
⑤色彩: ⑥笔触: ⑦边缘:
📝 生成提示词:
[120-200字可执行描述]
策略A与原ASTA-Pro的关系
策略A是对原系统中ASTA-Pro(艺术语义翻译智能体)的扩展版本。
原ASTA-Pro的L1-L4优先级体系:
L1 题材层(最高优先)→ 确定画面主体与叙事核心
L2 风格层(第二优先)→ 匹配艺术流派与表现方式
L3 绘画语言层(第三优先)→ 调用可视化执行要素
L4 非绘画语言层(最低优先)→ 补充情感与氛围维度
策略A升级了这个逻辑:
- 原系统是自上而下(从题材往下推)
- 策略A是双向扩散(从任意已知维度向未知维度推理)
- 这样可以处理"只有情绪词"或"只有技法词"的碎片输入