支持的模型

Edge Kit 支持符合各 engine 预期模型家族布局的本地模型目录。

开发者预览

在开发者预览期间，模型支持范围正在扩展。发布前请在目标设备类别上验证每个模型。

类别

类别	Engine	输入	输出
LLM	`LLMEngine`	文本消息	流式文本
VLM	`VLMEngine`	文本消息和图像	流式文本
STT	原生 ASR 使用 `STTEngine`；`WhisperEngine` 仅作为预览桥接	音频	文本
TTS	`TTSEngine`	文本	PCM 音频

类别	推荐起点
LLM	Qwen3-4B-4bit、Qwen3.5-0.8B、Qwen3.5-4B-4bit、Qwen3.5-9B-4bit
VLM	Qwen3.5-4B-4bit VLM variant
STT	`STTEngine` 使用 Qwen3-ASR-0.6B-8bit；Whisper-family 文件只适用于 app 已提供真实 Whisper binding 的场景
TTS	Qwen3-TTS-12Hz-0.6B-CustomVoice-bf16

iOS 内存限制低于物理 RAM。请在你计划支持的确切设备类别上测试。

预览模型通过 Hugging Face 分发。Edge Kit 可以从以下来源加载：

import EdgeInference

let engine = LLMEngine()
let modelURL = URL(fileURLWithPath: "/path/to/model")

try await engine.loadLocal(directory: modelURL)

使用与受支持模型家族兼容的 safetensors-format 模型。为了获得最佳结果：