跳到主要内容

架构与产品边界

本页说明 Edge 开发者产品如何连接,以及你的 agent 应该集成在哪一层。

层级图

┌─────────────────────────────────────────────┐
│ Your Agent │
│ UI · App 策略 · local user data · 工具 │
├─────────────────────────────────────────────┤
│ Edge Kit Edge Halo Edge Mesh │
│ inference SDK personalization local mesh │
├─────────────────────────────────────────────┤
│ Edge Engine runtime │
└─────────────────────────────────────────────┘

开发期工具:
Edge Studio → Edge Scaffold → Xcode project

产品职责

产品职责不负责
Edge Engine原生模型执行、运行时调度和底层 cache primitives。App UI、tool policy、用户数据或 app 存储。
Edge Kit公开 Swift SDK:推理、模型管理、EdgeData、EdgeMesh、EdgeDataMeshBridge、EdgeSession、EdgeUI 和语音。产品业务逻辑或私有用户数据策略。
Edge Halo个性化生命周期:画像任务、Neural Imprint capsule 校验、恢复编排和 失败即关闭 兼容性检查。模型 forward、mesh 传输或 App 专属 数据导入。
Edge Studio本地工作台:优化、benchmark、导出、artifact 生成和设备协调。已发布 agent 内的 runtime 行为。
Edge Scaffold参考 iOS agent 模板,展示推荐集成方式。生产 App 的共享 runtime 依赖。请 fork/export 后由你的 app 自己拥有。

你的 agent 是组合点。它决定哪些用户数据可以进入个性化、哪些工具可用、何时运行个性化,以及用户如何查看或关闭它。

Runtime 流程

1. 用 Edge Kit 加载 base model。
2. 在 agent 中注册工具和本地数据 surface。
3. 可选:用本地 app-approved 输入运行 Edge Halo profile job。
4. 生成或接收 Neural Imprint 产物。
5. 恢复前做兼容性校验。
6. 用已恢复状态运行 chat,不在请求时重复拼接 profile text。

关键边界:Neural Imprint 是本地 artifact 和 restore 流程。它不是请求时 prompt stuffing,也不是远程 profile 服务。

开发流程

Source model
→ Edge Studio analysis / optimization / benchmark
→ export model + runtime config
→ Edge Scaffold reference project
→ your agent integrates Edge Kit + Edge Halo
→ real-device validation

开发期使用 Edge Studio。发布 App 中使用 Edge Kit 和 Edge Halo。Edge Scaffold 是参考实现,不是隐藏依赖。

数据边界

数据Owner是否离开当前设备
Model weightsApp bundle、本地 cache 或用户下载默认不离开
Prompt 与对话历史你的 agent默认不离开
Tool 结果 与 app facts你的 agent / EdgeData默认不离开
Profile inputs你的 agent默认不离开
Neural Imprint 产物你的 agent / Edge Halo 生命周期仅在用户启用后传给受信任的自有设备
设备状态与 receiptsEdgeMesh / Edge Studio pairing仅本地 mesh

不要把原始 transcript、correction 或私有 facts 放进远程日志。如果支持流程需要诊断信息,导出 hash、schema version、状态回执 和本地文件名,而不是用户内容。

兼容性闸门

个性化 artifact 在 runtime identity 变化时必须 失败即关闭。至少校验:

  • Base model identity 和 family。
  • Model shape 和 layer count。
  • Tokenizer 与 chat template identity。
  • Runtime version。
  • Tool schema hash。
  • Neural Imprint 产物 hash 与 prefix 元数据。

如果闸门失败,保持 base model active,并展示清晰恢复路径:重新生成、重新导出或加载匹配模型。

公开抽象层级

开发者文档只描述概念、API 和工作流。不会描述私有个性化算法、内部训练目标、kernel 实现细节或内存预算实现细节。

使用这些文档集成产品;使用 Edge Scaffold 和 API reference 查具体代码路径。

如需了解 Neural Imprint 产物 restore、LoRA/SFT 与 prompt stuffing 的部署取舍,请阅读 Neural Imprint vs LoRA