MNN Chat 2025安卓版(com.alibaba.mnnllm.android),高效部署大语言模型!支持千问、百川、LLAMA等多种模型,兼容Tensorflow、ONNX等格式。亮点在于多模态大模型支持,新增LLM单步执行、扩展采样算法等功能,CPU/GPU性能大幅优化,加载速度更快。适用于手机、PC等设备,快来体验流畅的AI对话!
MNN-LLM是基于MNN引擎开发的大语言模型运行方案,解决大语言模型在本地设备的高效部署问题(手机/个人电脑/嵌入式设备)。支持常见的千问/百川/智谱/LLAMA等大语言模型。
1、在本站下载安装软件,打开后进入主页,进入主页可以看到AI模型,大家可以根据自己的需求选择想要部署的AI模型;
2、然后选择需要下载的文件,直接点击就能快速下载;
3、还可以在搜索框输入关键词进行搜索下载。
支持 Tensorflow、Caffe、ONNX、Torchscripts 等主流模型文件格式,支持CNN / RNN / GAN / Transformer 等主流网络结构。
支持多输入多输出,支持任意维度的输入输出,支持动态输入(输入大小可变),支持带控制流的模型
算子丰富,支持 178 个Tensorflow Op、52个 Caffe Op、163个 Torchscipts Op、158 个 ONNX Op(ONNX 基本完整支持)
支持 服务器 / 个人电脑 / 手机 及具有POSIX接口的嵌入式设备,支持使用设备的 CPU / GPU 计算,支持部分设备的 NPU 计算(IOS 11 + CoreML / Huawei + HIAI / Android + NNAPI)
支持 Windows / iOS 8.0+ / Android 4.3+ / Linux 及具有POSIX接口的操作系统
1、兼容 Tensorflow、Caffe、ONNX、Torchscripts 等多种主流模型文件格式,并适配 CNN、RNN、GAN、Transformer 等主流网络架构。
2、具备多输入多输出能力,可处理任意维度的输入输出数据,支持动态输入(即输入大小不固定),同时兼容含有控制流的模型。
3、算子库丰富,涵盖 178 个 Tensorflow 操作符、52 个 Caffe 操作符、163 个 Torchscripts 操作符、158 个 ONNX 操作符(ONNX 操作符基本实现全面支持)。
4、广泛适用于服务器、个人电脑、手机以及具有POSIX接口的嵌入式设备,支持利用这些设备的 CPU、GPU 进行计算,同时部分设备还支持 NPU 计算(如 IOS 11 及以上版本的 CoreML、华为 HIAI、Android NNAPI)。
5、操作系统兼容性强,支持 Windows、iOS 8.0 及以上版本、Android 4.3 及以上版本、Linux 以及具有POSIX接口的其他操作系统。
LLM 相关更新
App 发布
Android
新增Android的大模型应用(LLM / Diffusion),详见 apps/Android/MnnLlmChat/README.md
iOS
新增 iOS 的大模型应用,详见 apps/iOS/MNNLLMChat/README.md
新特性
模型支持
支持 Qwen2-VL / Qwen2-Audio / Qwen2.5-VL 等多模态大模型的导出和运行。
支持 DeepSeek-R1-1.5B-Qwen 和 DeepSeek-R1-7B-Qwen
LLM 单步执行支持
新增了对 LLM 单步执行的支持,便于调试和优化模型推理过程。
LLM 扩展采样算法支持
扩展了采样算法的支持,提升了模型推理的灵活性和多样性。
LLM 导出模型时支持输出历史 Token 的概率值
在导出 LLM 模型时,新增了输出历史 Token 概率值的功能,便于后续分析和优化。
LLM-CPU 支持 mmap 文件缓存
新增了对 mmap 文件缓存的支持,使二次加载模型时避免内存重排,提升了加载效率。
性能优化
CPU 多线程性能进一步提升
对 LLM 多线程性能进行了优化,进一步提升了整体推理速度。
CPU prefill 性能优化
优化了 CPU 上 prefill 性能,使 1024 token 输入和 512 token 输入的 prefill 性能持平。
GPU 优化 OpenCL AutoTuning 耗时
优化了 OpenCL AutoTuning 的耗时,避免了首次推理耗时过长的问题。
GPU 优化:Metal / OpenCL 支持 fp16 的 scale/bias,支持对称量化优化
Metal / OpenCL 后端支持 fp16 的 scale/bias 和对称量化优化的支持,提升了推理效率。
LLM 加速:Metal / OpenCL 后端支持 scale/bias 使用 fp16
Metal / OpenCL 支持 scale/bias 使用 fp16(设置 precision = low 时启用),进一步优化了 GPU 推理性能。
用户评论
最新更新
MNN Chat官方下载2025安卓版v0.7.1
娱乐软件 / 34.5M / 09-02
野狐少儿围棋官方版v8.1.11
学习教育 / 220.1M / 09-02
去上网app官方版v1.9.37最新版
生活工具 / 83.4M / 09-02
途虎养车软件下载v7.37.0
生活工具 / 86.3M / 09-02
拼多多老人模式版v7.74.0
网络购物 / 24.2M / 09-02
poki小游戏手机版下载v1.0.3
娱乐软件 / 22.5M / 09-02
欧朋浏览器官方下载安装v12.104.0.1
网络应用 / 39.3M / 09-02
酷狗直播平台v6.99.40
音乐软件 / 84.3M / 09-02
移动经纪人官方版v9.95.0
生活工具 / 296.9M / 09-02
途虎养车商家版v7.37.0
生活工具 / 86.3M / 09-02
本类排行
抖音国际版海外版下载(TikTok)v41.5.4
视频软件 / 485.8M / 09-01
deepseek智能助手下载v1.3.3
娱乐软件 / 11.7M / 09-01
豆包人工智能下载v10.1.0
娱乐软件 / 104.1M / 08-26
豚豚剧2025最新版本下载v1.0.1.9
视频软件 / 69.7M / 09-01
囧次元app正版下载免费版v1.5.8.0
图书杂志 / 70.9M / 08-07
囧次元无广告版下载安装最新版2025v1.5.8.0
图书杂志 / 49.6M / 09-01
omofun最新版免费app下载v1.1.4
视频软件 / 100.3M / 08-07
动漫共和国app免费下载最新版v1.0.0.7
图书杂志 / 70.7M / 09-01
追番达人软件下载v3.8.1
视频软件 / 68.1M / 09-01
猪猪软件库app免费下载安装v2.7
娱乐软件 / 6.3M / 08-16
热门推荐
淘应用官方免费下载安装2025v1.5.0
多闪app最新版v35.8.0
抖音极速版免费下载安装官方最新版v35.8.1
ehviewer最新版2025v2.0.0.1
番喜视频追剧app官方最新版本v1.7.7
扫描全能王永久免费版v7.3.0.2708260020
美册视频编辑制作最新版v6.2.6
guitartuna吉他调音器下载免费版v7.80.0