




MNN Chat 2025安卓版(com.alibaba.mnnllm.android),高效部署大语言模型!支持千问、百川、LLAMA等多种模型,兼容Tensorflow、ONNX等格式。亮点在于多模态大模型支持,新增LLM单步执行、扩展采样算法等功能,CPU/GPU性能大幅优化,加载速度更快。适用于手机、PC等设备,快来体验流畅的AI对话!
MNN-LLM是基于MNN引擎开发的大语言模型运行方案,解决大语言模型在本地设备的高效部署问题(手机/个人电脑/嵌入式设备)。支持常见的千问/百川/智谱/LLAMA等大语言模型。
1、在本站下载安装软件,打开后进入主页,进入主页可以看到AI模型,大家可以根据自己的需求选择想要部署的AI模型;

2、然后选择需要下载的文件,直接点击就能快速下载;

3、还可以在搜索框输入关键词进行搜索下载。

支持 Tensorflow、Caffe、ONNX、Torchscripts 等主流模型文件格式,支持CNN / RNN / GAN / Transformer 等主流网络结构。
支持多输入多输出,支持任意维度的输入输出,支持动态输入(输入大小可变),支持带控制流的模型
算子丰富,支持 178 个Tensorflow Op、52个 Caffe Op、163个 Torchscipts Op、158 个 ONNX Op(ONNX 基本完整支持)
支持 服务器 / 个人电脑 / 手机 及具有POSIX接口的嵌入式设备,支持使用设备的 CPU / GPU 计算,支持部分设备的 NPU 计算(IOS 11 + CoreML / Huawei + HIAI / Android + NNAPI)
支持 Windows / iOS 8.0+ / Android 4.3+ / Linux 及具有POSIX接口的操作系统
1、兼容 Tensorflow、Caffe、ONNX、Torchscripts 等多种主流模型文件格式,并适配 CNN、RNN、GAN、Transformer 等主流网络架构。
2、具备多输入多输出能力,可处理任意维度的输入输出数据,支持动态输入(即输入大小不固定),同时兼容含有控制流的模型。
3、算子库丰富,涵盖 178 个 Tensorflow 操作符、52 个 Caffe 操作符、163 个 Torchscripts 操作符、158 个 ONNX 操作符(ONNX 操作符基本实现全面支持)。
4、广泛适用于服务器、个人电脑、手机以及具有POSIX接口的嵌入式设备,支持利用这些设备的 CPU、GPU 进行计算,同时部分设备还支持 NPU 计算(如 IOS 11 及以上版本的 CoreML、华为 HIAI、Android NNAPI)。
5、操作系统兼容性强,支持 Windows、iOS 8.0 及以上版本、Android 4.3 及以上版本、Linux 以及具有POSIX接口的其他操作系统。
LLM 相关更新
App 发布
Android
新增Android的大模型应用(LLM / Diffusion),详见 apps/Android/MnnLlmChat/README.md
iOS
新增 iOS 的大模型应用,详见 apps/iOS/MNNLLMChat/README.md
新特性
模型支持
支持 Qwen2-VL / Qwen2-Audio / Qwen2.5-VL 等多模态大模型的导出和运行。
支持 DeepSeek-R1-1.5B-Qwen 和 DeepSeek-R1-7B-Qwen
LLM 单步执行支持
新增了对 LLM 单步执行的支持,便于调试和优化模型推理过程。
LLM 扩展采样算法支持
扩展了采样算法的支持,提升了模型推理的灵活性和多样性。
LLM 导出模型时支持输出历史 Token 的概率值
在导出 LLM 模型时,新增了输出历史 Token 概率值的功能,便于后续分析和优化。
LLM-CPU 支持 mmap 文件缓存
新增了对 mmap 文件缓存的支持,使二次加载模型时避免内存重排,提升了加载效率。
性能优化
CPU 多线程性能进一步提升
对 LLM 多线程性能进行了优化,进一步提升了整体推理速度。
CPU prefill 性能优化
优化了 CPU 上 prefill 性能,使 1024 token 输入和 512 token 输入的 prefill 性能持平。
GPU 优化 OpenCL AutoTuning 耗时
优化了 OpenCL AutoTuning 的耗时,避免了首次推理耗时过长的问题。
GPU 优化:Metal / OpenCL 支持 fp16 的 scale/bias,支持对称量化优化
Metal / OpenCL 后端支持 fp16 的 scale/bias 和对称量化优化的支持,提升了推理效率。
LLM 加速:Metal / OpenCL 后端支持 scale/bias 使用 fp16
Metal / OpenCL 支持 scale/bias 使用 fp16(设置 precision = low 时启用),进一步优化了 GPU 推理性能。
用户评论
最新更新
欧伊交易所平台官方版v6.147.0
金融理财 / 388.9M / 11-27
cutme三国杀辅助工具下载v2.2正版
娱乐软件 / 66.8M / 11-27
盘库吧网盘资源搜索神器手机版v1.0
娱乐软件 / 1.1M / 11-27
郑州市民卡官方最新版2026v1.1.10
生活工具 / 61.1M / 11-27
荣耀智慧能力基础服务平台v7.1.6.730最新版
娱乐软件 / 158.8M / 11-27
o意交易所官方安卓最新版v6.147.0
金融理财 / 388.0M / 11-27
丰巢管家app快递员版v5.72.0
办公商务 / 140.8M / 11-27
ABC Zone英语角安装包(改名英语天天练)1.32.01
学习教育 / 237.6M / 11-27
奥维地图2026年高清最新版下载v10.4.0高清版
地图导航 / 85.0M / 11-27
360手机卫士极速版安卓版v6.1.4
系统工具 / 49.1M / 11-27
本类排行
抖音国际版海外版下载(TikTok)v42.7.2
视频软件 / 448.9M / 11-27
deepseek智能助手下载v1.5.4
娱乐软件 / 12.4M / 11-26
豆包人工智能下载v11.2.0_11020040
娱乐软件 / 130.5M / 11-26
豚豚剧2025最新版本下载v1.0.1.9
视频软件 / 69.7M / 10-09
囧次元app正版下载免费版v1.5.8.0
图书杂志 / 70.9M / 08-07
囧次元无广告版下载安装最新版2025v1.5.8.0
图书杂志 / 36.5M / 09-22
omofun最新版免费app下载v1.1.52
视频软件 / 131.7M / 11-24
动漫共和国app免费下载最新版v1.0.0.7
图书杂志 / 70.7M / 09-01
追番达人软件下载v3.9.8
视频软件 / 43.9M / 10-16
猪猪软件库app免费下载安装v3.0
娱乐软件 / 6.3M / 10-31
热门推荐
番茄免费小说下载安装app安卓版v6.9.9.32
夸克app官方正版下载最新版本v10.1.0.971
taptap免费下载最新版本v2.90.0-rel#100100
完美世界竞技平台手机版下载v3.7.4.198
vivo游戏中心app最新版本2026v7.1.50.3
微信app下载安装官方版2026v8.0.66_28004230
weverse安卓下载最新版本v3.9.2
qq音乐app官方下载最新版本v14.11.0.8