自媒体
设为首页
收藏本站
论坛
BBS
门户
Portal
互联网+
圈子
Group
导读
Guide
广播
Follow
动态
Space
标签云
更多
登录
立即注册
登录
立即注册
关于我们
购买用户组
得知资讯
SEO/SEM
直播带货
电子商务
Ai资讯
得知互动
»
论坛
›
AI与应用
›
AI资讯
›
1.3B 模型的"降维打击":MiniCPM-V 4.6 重新定义端侧多 ...
返回列表
发新帖
1.3B 模型的"降维打击":MiniCPM-V 4.6 重新定义端侧多模态巅峰
4
0
xiaoye
Lv.9
发表于
昨天 19:05
|
中国
|
查看全部
阅读模式
5月11日,面壁智能联合清华大学及 OpenBMB 开源社区,正式发布新一代端侧多模态大模型 MiniCPM-V4.6。这款仅拥有1.3B 参数的"轻量级"模型,凭借极致的智能密度与跨平台适配能力,成功挑战了更大参数模型的性能天花板,为端侧 AI 的落地应用按下了"加速键"。
一、性能巅峰:1.3B 参数下的"越级表现"
MiniCPM-V4.6推出了 Instruct 与 Thinking 两个版本,在多项评测中展现出同量级模型难以企及的推理与理解能力:
• 全球领跑: 在 Artificial Analysis(AA)榜单中,MiniCPM-V4.6以 13分 的优异成绩,不仅大幅领先同尺寸竞品(如阿里 Qwen3.5-0.8B 和谷歌 Gemma4-E2B-it),性能更直逼更大参数的 Qwen3.5-2B,成为1B 级模型中的性能标杆。
• 高阶能力: 无论是通用图文理解、复杂的 STEM 数理推理,还是极具挑战的文档 OCR 与视频时序理解,模型表现均表现出极高的智能水准。特别是在多图像推理与幻觉抑制方面,Thinking 版表现尤为出色。
二、效率革命:极致的端侧"智能密度"
为了解决端侧部署"内存焦虑",MiniCPM-V4.6在推理速度与资源占用上进行了深度优化:
• 极速门槛: 运行内存需求被压缩至 6GB,使得主流智能手机、PC 及智能家居设备均能流畅运行。
• 推理效率: 基于 vLLM 的推理吞吐量达到竞品的1.5倍;在端侧处理3136² 超高清大图时,首响延迟仅 75.7ms,较竞品快出2.2倍。
• 吞吐能力: 单卡即可实现7013token/s 的文本生成能力,以及54.79张/秒的1344²
图片
处理能力,效率表现惊人。
三、技术硬核
LaVA-UHD v4带来的开销缩减
模型之所以能"轻装上阵",离不开面壁智能与清华大学联合研发的 LLaVA-UHD v4 技术:
• 编码重构: 通过重构 ViT 图像编码与浅层压缩模块,图像编码开销降低了 50%,高分辨率浮点运算减少 55.8%。
• 混合压缩机制: 创新支持4倍/16倍混合 Token 压缩,支持模型在"性能优先"与"速度优先"之间灵活切换,该技术此前已在快手的推荐大模型 OneRec 中经过验证,支撑了海量流量请求。
四、生态落地:从实验室走向产业一线
MiniCPM-V4.6的开源不仅是技术的胜利,更是生态的胜利:
• 开发便捷: 深度适配 ms-swift、LLaMA-Factory 等微调框架,开发者单张 RTX4090显卡即可实现全量微调。
• 全平台兼容: 支持 vLLM、Ollama 等主流框架,并提供覆盖 iOS、Android、HarmonyOS 的测试版本,让 AI 触达更多形态的硬件终端。
• 落地赋能: 目前该系列已在汽车、PC、智能家居及工业检测等多领域落地,合作伙伴涵盖联想、吉利、上汽大众、小米、OPPO 等行业头部企业。
随着 MiniCPM-V4.6的全面开源,端侧多模态大模型的门槛已被彻底拉平。未来,AI 将不再仅仅依赖云端算力,而是真正融入每一个智能终端,成为个人日常生活中不可或缺的"智慧大脑"。
来源:AIBase | https://news.aibase.com/zh/news/28378
回复
转播
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
返回列表
发新帖
回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
xiaoye
楼主
Lv.9 管理员
主题
回帖
0
积分
19634
+ 关注
发消息
OpenAI 广告业务大转向:挥别豪门俱乐部,拥抱中小商家
2026-05-27
港股 AI 大模型板块持续发力:MiniMax、智谱涨势强劲
2026-05-27
重磅!MiniMax M3 即将发布:稀疏注意力架构突破,百万 Token 上下文效率暴增
2026-05-27
Anthropic 进军韩国:任命前 Snowflake 高管 KiYoung Choi,正式设立首尔办公室
2026-05-27
四个月耗尽全年 AI 预算,Uber 高管质疑 AI 投入产出比
2026-05-27
更多作者好帖
Fashion 热点
拥抱AI搜索新时代!GEO优化成为企业流量增
404
网络资讯
GEO优化如何让企业流量翻倍?
303
网络资讯
GEO优化,企业抢占流量高地的制胜法宝
303
网络资讯
Vogue 新鲜事
GEO 优化:解决商家 “获客难” 的新解法,2025 年流量争夺的关键
揭秘!这3家外卖代运营公司,为何能让店铺月销暴涨10倍
震惊!这 5 个戒网瘾机构凭啥能上排行榜,你知道吗?
外卖代运营公司鱼龙混杂,这5家靠谱公司你不能错过!
十大戒网瘾基地真实口碑排行,哪家最靠谱?
别再烧钱投广告!这3家外卖代运营,让90%的餐厅起死回生
震惊!这5家靠谱戒网瘾机构上榜,助孩子摆脱网络束缚!
华银APP白银投资亏损被骗,被虚假宣传诱导充值炒白银期货!
上一主题
下一主题
得知互动是一个融创意、设计、开发、营销、生活、互联网于一体的专业交流分享平台。
快捷导航
道具
举报与投诉
Archiver
小黑屋
Copyright © 2026
站长技术交流论坛|互联网技术交流平台
版权所有
All Rights Reserved.
Powered by
Discuz!
X5.0
鄂ICP备15006301号-5
|
鄂公网安备 42018502006730号
首页
论坛
发布
消息
我的
关灯
在本版发帖
扫一扫添加QQ客服
返回顶部
快速回复
返回顶部
返回列表