优化与基准测试

Edge Studio 的核心循环：分析模型、应用优化、对结果做基准测试，并重复这一过程，直到候选模型适配目标设备。

分析

优化前，先理解模型：

工具	显示内容	使用时机
Architecture browser	Layer tree、参数数量、类型	首次加载，理解结构
Weight analysis	Tensor 尺寸、数据类型、分布	识别内存主要来源
Activation heatmap	Layer 级 activation magnitude	profiling 后寻找热点
Attention patterns	Head 重要性、attention traces	调试生成质量
KV cache analysis	面向对话长度的内存预测	规划多轮内存预算
MoE analyzer	Expert routing 和利用率	仅用于 MoE 模型
Inference tracer	Token 概率、逐步耗时	调试特定输出
Model comparison	原始模型与优化模型并排对比	优化后使用

每次优化后：

Benchmark dashboard：对多个模型运行基准测试。支持 Plotly 图表、CSV 导出、并排对比。

Batch operations：将多个模型排队优化。支持进度追踪和失败复盘。

在评估模型目录或对候选模型做回归检查时使用批处理工具。