分析对象: Synapse — 基于 Chorus AI-DLC 框架的科研版本 分析日期: 2026-03-30
Chorus 的核心理念是 "Reversed Conversation"(反转对话)—— AI 提议、人类验证。Synapse 继承了这一理念,但将应用领域从 软件开发生命周期(SDLC) 迁移到 科研生命周期。
| 维度 | Chorus | Synapse |
|---|---|---|
| 领域 | 软件开发 | 学术 / 实验研究 |
| 核心流程 | Idea → Proposal → Task → Verify | Research Question → Experiment Design → Experiment Run → Verify |
| 角色体系 | PM / Developer / Admin | Research Lead / Researcher / PI (Principal Investigator) |
| 工作单元 | 代码实现任务 | 实验执行与数据收集 |
| 验证标准 | 功能测试、代码审查 | 指标阈值、可复现性、Go/No-Go 判定 |
| 独有能力 | — | 文献管理、GPU 资源调度、基线对比、假设检验、自主实验循环 |
Synapse 的核心设计哲学可以归纳为三点:
-
结构化假设驱动:科研不同于工程——每个实验背后必须有明确的假设(Hypothesis Statement)和零假设(Null Hypothesis)。Synapse 强制将这一学术规范嵌入工作流。
-
可复现性优先:通过
ExperimentRegistry模型记录配置、环境、随机种子、指标和产出物,使每次实验天然具备可复现性追踪能力。 -
计算资源感知:科研实验消耗 GPU 等昂贵计算资源,Synapse 将计算资源管理(池 → 节点 → GPU → 预留)作为一等公民纳入平台。
Chorus 有 21 个 Prisma 模型,Synapse 扩展到 31 个——新增 10 个科研特有模型,并对核心模型做了语义重命名和字段扩展。
| Chorus 模型 | Synapse 模型 | 新增关键字段 |
|---|---|---|
Project |
ResearchProject |
goal, datasets, evaluationMethods, latestSynthesisAt, latestSynthesisSummary, computePoolUuid, autonomousLoopEnabled, autoSearchEnabled, deepResearchDocUuid |
Idea |
ResearchQuestion |
hypothesisStatement, nullHypothesis, priorWork, researchType (exploratory/confirmatory/replication), parentQuestionUuid, generatedByAgentUuid, reviewStatus, reviewNote |
Task |
ExperimentRun |
experimentDesignUuid, experimentConfig, experimentResults, baselineRunUuid, computeBudgetHours, computeUsedHours, outcome, earlyStopTriggered |
Proposal |
ExperimentDesign |
保持草案容器模式,语义重命名 |
ElaborationRound |
HypothesisFormulation |
强调假设形成过程 |
ElaborationQuestion |
HypothesisFormulationQuestion |
同上 |
RelatedWork— 学术论文追踪,支持 arXiv 集成和自动元数据抓取
Experiment— 独立于 ExperimentRun 的实验实体,带liveStatus/liveMessage/liveUpdatedAt实时状态ExperimentProgressLog— 实验进度日志,按阶段(phase)记录ExperimentRegistry— 可复现性追踪(config, environment, seed, metrics, artifacts)Baseline— 性能基线,用于实验间对比
ComputePool— GPU 计算资源池ComputeNode— 计算节点(EC2 实例,SSH/SSM 访问)ComputeGpu— GPU 设备清单及遥测数据(利用率、温度、显存)RunGpuReservation— GPU 到实验运行的预留ExperimentGpuReservation— GPU 到实验的预留
这是一个特别值得关注的改动。Chorus 的验收标准是纯文本描述,Synapse 将其升级为 结构化的 Go/No-Go 判定:
新增字段:
metricName String? // 指标名称,如 "accuracy", "F1-score"
operator String? // 比较运算符: >=, <=, >, <, ==
threshold Float? // 阈值: 0.95
isEarlyStop Boolean // 是否触发提前停止
actualValue Float? // 实验实际值
这使得系统可以 自动判定实验是否达标,而不依赖人工逐条审查。
| Chorus 角色 | Synapse 角色 | 职责变化 |
|---|---|---|
pm_agent |
research_lead / research_lead_agent |
从产品需求管理转为实验设计编排 |
developer_agent |
researcher / researcher_agent |
从代码实现转为实验执行与数据收集 |
admin_agent |
pi / pi_agent |
从系统管理转为学术 PI 角色——审批实验设计、验证结果、判定可复现性 |
这是最有意思的角色设计。在学术场景中,PI 不仅是管理员,更是:
- 实验设计审批者:approve / reject experiment designs
- 结果验证者:verify experiment runs,判断实验是否达到学术标准
- 可复现性裁判:
synapse_verify_reproducibility— 标记实验是否可复现 - 研究问题审查者:
synapse_pi_review_research_question— 审核 AI Agent 自动生成的研究问题
PI 拥有最高权限,可以使用所有 Research Lead 和 Researcher 的工具。
| 服务 | 职责 |
|---|---|
experiment.service.ts |
实验全生命周期管理 |
experiment-design.service.ts |
实验设计草案管理与验证 |
experiment-progress.service.ts |
实时进度日志与状态更新 |
experiment-registry.service.ts |
可复现性注册(配置、环境、种子、指标、产出物) |
experiment-run.service.ts |
运行实例 CRUD |
experiment-run-criteria.service.ts |
验收标准标记与自检 |
experiment-run-dependency.service.ts |
运行依赖 DAG 管理 |
experiment-run-lifecycle.service.ts |
状态机转换与自动化 |
experiment-run-query.service.ts |
复杂查询 |
experiment-run-side-effects.service.ts |
副作用处理(GPU 释放、综述刷新、@mention) |
| 服务 | 职责 |
|---|---|
research-project.service.ts |
研究项目管理(含自主循环、自动搜索配置) |
research-question.service.ts |
层级化研究问题管理(父子关系) |
hypothesis-formulation.service.ts |
多轮 Q&A 假设形成与验证 |
related-work.service.ts |
文献管理 + arXiv 元数据自动抓取 |
baseline.service.ts |
基线创建、切换、对比 |
criteria-evaluation.service.ts |
自动化指标评估 + 提前停止判定 |
project-synthesis.service.ts |
从已完成实验自动生成项目综述文档 |
compute.service.ts |
GPU 池管理、节点同步、预留系统、遥测轮询 |
所有工具从 chorus_* 重命名为 synapse_*。
| 工具 | 功能 |
|---|---|
synapse_search_papers |
Semantic Scholar 论文搜索 |
synapse_add_related_work |
手动添加论文(支持 arXiv URL 自动抓取元数据) |
synapse_get_related_works |
获取项目相关文献列表 |
| 工具 | 功能 |
|---|---|
synapse_list_compute_nodes |
列出计算池、节点、GPU |
synapse_get_node_access_bundle |
获取 SSH 凭证(用于已分配的实验) |
synapse_sync_node_inventory |
EC2 + GPU 清单同步 |
synapse_report_gpu_status |
遥测上报(利用率、显存、温度) |
synapse_start_experiment_run_with_gpus |
认领运行 + 预留 GPU + 启动(原子操作) |
| 工具 | 功能 |
|---|---|
synapse_register_experiment |
注册实验(可复现性追踪) |
synapse_report_metrics |
上报指标(自动评估 Go/No-Go 标准) |
synapse_check_criteria |
检查当前标准满足情况 |
synapse_request_early_stop |
请求提前停止实验 |
| 工具 | 功能 |
|---|---|
synapse_research_lead_generate_project_ideas |
AI 自主生成研究问题 |
synapse_create_baseline |
创建性能基线 |
synapse_compare_results |
基线对比分析 |
synapse_create_rdr |
创建 Research Decision Record(研究决策记录) |
synapse_research_lead_start_hypothesis_formulation |
启动假设形成(minimal/standard/comprehensive 三档深度) |
| 工具 | 功能 |
|---|---|
synapse_pi_review_research_question |
审查研究问题(accept/reject) |
synapse_verify_reproducibility |
验证实验可复现性 |
synapse_set_active_baseline |
设置项目活跃基线 |
Chorus 的 Idea 是扁平列表。Synapse 通过 parentQuestionUuid 引入了树状结构:
RQ1: Does model X outperform Y on dataset Z?
├── RQ1.1: What is the impact of hyperparameter α?
├── RQ1.2: How does performance vary across data splits?
└── RQ1.3: Is the improvement statistically significant?
这反映了真实科研中"大问题拆解为子问题"的思维方式。
Chorus 的 Elaboration 是通用的需求澄清。Synapse 将其改造为结构化的假设形成过程:
- 三档深度:
minimal(快速确认)、standard(常规)、comprehensive(深度探讨) - 多轮 Q&A:Agent 生成方法论相关的结构化问题 → 研究者回答 → 验证 → 必要时追加轮次
- 预定义选项 + 自由文本:问题可附带选项(如"使用哪种统计检验?"),同时保留 "Other" 自由回答
这是 Synapse 最精巧的设计之一:
实验定义阶段:
AC1: accuracy >= 0.95 (Go/No-Go)
AC2: latency <= 100ms (Go/No-Go)
AC3: memory_usage <= 8GB (Go/No-Go, isEarlyStop=true)
实验执行阶段:
Researcher 调用 synapse_report_metrics({ accuracy: 0.97, latency: 85, memory_usage: 12 })
→ 系统自动评估:
AC1: 0.97 >= 0.95 ✅ PASS
AC2: 85 <= 100 ✅ PASS
AC3: 12 <= 8 ❌ FAIL + isEarlyStop → 触发提前停止通知
这将科研中常见的"实验达标判定"从人工检查变为自动化流水线。
完整的三层资源模型:
ComputePool (e.g., "ML Training Cluster")
├── ComputeNode (e.g., "p3.8xlarge - i-0abc123")
│ ├── ComputeGpu (GPU 0: V100, 16GB, 利用率 85%, 温度 72°C)
│ ├── ComputeGpu (GPU 1: V100, 16GB, 空闲)
│ └── ComputeGpu (GPU 2: V100, 16GB, 已预留给 Run-X)
└── ComputeNode (e.g., "p4d.24xlarge - i-0def456")
└── ...
关键能力:
- 原子操作:
synapse_start_experiment_run_with_gpus一步完成 claim run + reserve GPU + start - 遥测轮询:GPU 利用率、温度、显存实时上报
- 预算追踪:
computeBudgetHours/computeUsedHours控制实验成本
autonomousLoopEnabled = true
autonomousLoopAgentUuid = <Research Lead Agent>
当项目实验队列清空时:
→ Agent 自动分析已完成实验结果
→ 生成新的研究问题(synapse_research_lead_generate_project_ideas)
→ 设计新实验
→ 提交给 PI 审批
→ 形成持续的科研探索循环
类似地,autoSearchEnabled 让 Agent 持续发现相关文献。
每次实验执行可注册为:
{
"config": { "learning_rate": 0.001, "batch_size": 32, "epochs": 100 },
"environment": { "python": "3.11", "torch": "2.1", "cuda": "12.1" },
"seed": 42,
"metrics": { "accuracy": 0.973, "f1": 0.968 },
"artifacts": ["model.pt", "results.csv"],
"reproducible": null // PI 验证后设为 true/false
}PI 可通过 synapse_verify_reproducibility 审核并标记。
| Chorus | Synapse |
|---|---|
| Projects | Research Projects |
| — | Compute(新增:GPU 池管理) |
| Agents | Agents |
| Settings | Settings |
| Chorus | Synapse | 变化 |
|---|---|---|
| Dashboard | Dashboard | 增加实验概览 |
| Ideas | Research Questions | 支持层级、假设字段 |
| — | Related Works | 全新:文献管理 |
| Proposals | Experiment Designs | 语义重命名 |
| — | Experiments | 全新:独立实验实体 + 实时状态 |
| Tasks | Experiment Runs | 增加指标、GPU、基线字段 |
| Documents | Documents | 增加实验设计关联 |
| — | Insights | 全新:项目综述 + 已完成实验分析 |
| Activity | Activity | 增加科研相关活动类型 |
- hypothesis-formulation-panel — 假设形成的多轮 Q&A 面板
- go-no-go-badge — Go/No-Go 标准状态徽章(✅ Pass / ❌ Fail)
- live-data-refresher — 实验实时状态刷新
- compute-node-form / compute-pool-form — GPU 资源管理表单
- design-filter — 实验设计筛选器
Chorus: cho_xxxxxxxx
Synapse: syn_xxxxxxxx
| 路由 | 用途 |
|---|---|
/api/research-projects |
替代 /api/projects |
/api/research-questions |
替代 /api/ideas |
/api/experiments |
全新:独立实验管理 |
/api/experiment-designs |
替代 /api/proposals |
/api/experiment-runs |
替代 /api/tasks |
/api/compute-nodes |
全新:计算节点管理 |
/api/compute-pools |
全新:计算资源池 |
/api/ssh-config |
全新:SSH 配置获取 |
基础技术栈完全相同(Next.js 15, TypeScript 5, Prisma 7, PostgreSQL, Redis, MCP SDK)。新增依赖:
| 依赖 | 用途 |
|---|---|
@hello-pangea/dnd |
拖拽排序(实验看板) |
shiki + streamdown |
代码高亮(实验结果展示) |
Synapse 不是简单的"换皮"——它是对 Chorus AI-DLC 框架的 领域特化(Domain Specialization)。核心架构(MCP 通信、反转对话、多 Agent 协作、草案→审批流程)完全复用,但在上层注入了科研领域的关键概念:
- 假设驱动(而非需求驱动)
- 指标量化(而非功能验证)
- 可复现性(科研独有需求)
- 计算资源感知(GPU 是稀缺资源)
- 文献生态(arXiv / Semantic Scholar 集成)
- 自主探索(AI Agent 主动提出新实验方向)
这证明了 Chorus 的 AI-DLC 框架具有良好的领域可迁移性——同一套"AI 提议、人类验证"的协作模式,可以从软件工程延伸到科学研究,未来也可能延伸到更多知识密集型领域。