边缘计算移动端部署

边缘端大模型部署实践

2026-02-089 min read

随着Apple Intelligence和Android Gemini的推进,端侧LLM成为热点。

端侧AI的优势

技术挑战

实践案例

我们在移动端部署了7B参数的模型,通过INT4量化和LoRA适配,在保持90%性能的同时,推理延迟控制在500ms以内。


本文作者:Jie Zhu | 发布于 2026-02-08