开始使用

安装 Edge Kit，加载本地模型，并从端侧 LLM 流式输出 token。

开发者预览

Edge Kit 处于开发者预览阶段。请固定测试过的包版本，并在每次升级后重新真机验证。

要求

Edge Kit 面向 Apple 平台发布。Android、Linux、HarmonyOS 和 Windows 支持在计划中。

要求	版本
iOS	17.0 或更高
macOS	14.0 或更高
Xcode	15 或更高
Swift	5.9 或更高
硬件	Apple Silicon

运行较大模型的 iOS 应用需要在 target 中启用 Increased Memory Limit entitlement。

使用 Swift Package Manager 安装

将 Edge Kit 添加到你的 Swift package：

// Package.swift
dependencies: [
    .package(url: "https://github.com/AtomGradient/edge-kit.git", exact: "1.0.0-rc97")
]

预览版本应精确固定。升级到新的 1.0.0-rcN tag 前，请重新真机验证。

预览访问权限

部分包解析路径可能因为 Edge Engine 等传递依赖需要 AtomGradient 预览访问权限或 SSH 访问权限。请在开发和 CI 环境中运行 swift package resolve 验证。

然后添加你需要的 product：

.target(
    name: "MyApp",
    dependencies: [
        .product(name: "EdgeInference", package: "edge-kit")
    ]
)

如果需要总入口 product，请使用 EdgeKit：

.product(name: "EdgeKit", package: "edge-kit")

运行你的第一个 LLM

import EdgeInference

let engine = LLMEngine()
let modelURL = URL(fileURLWithPath: "/path/to/qwen-model")

try await engine.loadLocal(directory: modelURL)

for try await chunk in engine.generate(
    messages: [.user("Write a one sentence definition of edge AI.")]
) {
    print(chunk.text, terminator: "")
}

准备已注册模型

ModelConfig 包含受支持模型家族的条目。先用 EdgeModelKit 准备模型，再通过 loadLocal(directory:) 加载本地缓存目录。

import EdgeInference
import EdgeModelKit

let engine = LLMEngine()

guard let config = ModelConfig.find(modelID: "qwen3.5-9b-4bit") else {
    throw EdgeRuntimeError.modelNotFound("qwen3.5-9b-4bit")
}

try await HFDownloader.shared.download(config: config) { progress in
    print("Download progress:", progress)
}

try await engine.loadLocal(directory: ModelCache.shared.cachedURL(for: config))

运行你的第一个 VLM

当模型接受图像和文本时，使用 VLMEngine。

import EdgeInference

let engine = VLMEngine()
let modelURL = URL(fileURLWithPath: "/path/to/vlm-model")
let imageURL = URL(fileURLWithPath: "/path/to/image.jpg")

try await engine.loadLocal(directory: modelURL)

for try await chunk in engine.generate(
    messages: [.user("Describe this image in one paragraph.")],
    images: [imageURL]
) {
    print(chunk.text, terminator: "")
}

在 iOS 上，将图像加载到内存后优先使用 ciImages: overload：

for try await chunk in engine.generate(
    messages: [.user("What is visible in this photo?")],
    ciImages: [ciImage]
) {
    print(chunk.text, terminator: "")
}

下一步

任务	指南
文本生成	LLM 指南
视觉语言推理	VLM 指南
模型缓存与下载	模型管理
iOS 内存指南	内存管理
平台支持	平台要求

要求​

使用 Swift Package Manager 安装​

运行你的第一个 LLM​

准备已注册模型​

运行你的第一个 VLM​

下一步​

要求

使用 Swift Package Manager 安装

运行你的第一个 LLM

准备已注册模型

运行你的第一个 VLM

下一步