MNN端侧部署教程
本教程介绍 MNN 端侧推理部署的完整流程,从环境配置到核心概念讲解,再到 LLM 部署实践。
教程概览
| 阶段 | 内容 | 文章数 |
|---|---|---|
| 环境配置 | 远程调试、交叉编译 | 2 篇 |
| 核心概念 | Backend、工厂模式、核心类 | 3 篇 |
| MNN-LLM | 配置、加载、推理 | 3 篇 |
1. 环境配置
搭建端侧开发调试环境的完整指南。
2. 核心概念
深入理解 MNN 框架的设计理念与核心组件。
| 文章 | 说明 | 状态 |
|---|---|---|
| Backend 介绍 | CPU/OpenCL/Vulkan 等后端的作用和选择 | ✅ 完成 |
| 工厂模式介绍 | MNN 中工厂模式的设计与应用 | 📝 TODO |
| 核心类介绍 | VARP、Expr、Op 等关键类的设计 | 🚧 WIP |
3. MNN-LLM
端侧大语言模型部署实践。
| 文章 | 说明 | 状态 |
|---|---|---|
| LLM 配置 | 模型配置、量化配置 | 📝 TODO |
| LLM 加载流程 | 模型文件到推理就绪的完整过程 | 📝 TODO |
| LLM 推理流程 | Token 处理、KV Cache 管理 | 📝 TODO |
相关链接
- MNN 官方仓库:alibaba/MNN
- MNN 文档:mnn-docs
- 问题反馈:GitHub Issues