自媒体
设为首页
收藏本站
论坛
BBS
门户
Portal
互联网+
圈子
Group
导读
Guide
广播
Follow
动态
Space
标签云
更多
登录
立即注册
登录
立即注册
关于我们
购买用户组
得知资讯
SEO/SEM
直播带货
电子商务
Ai资讯
得知互动
»
论坛
›
AI与应用
›
AI资讯
›
端侧大模型迎突破!Liquid AI 开源混合专家模型 LFM2.5 ...
返回列表
发新帖
端侧大模型迎突破!Liquid AI 开源混合专家模型 LFM2.5
21
0
xiaoye
Lv.9
发表于
6 天前
|
中国
|
查看全部
阅读模式
人工智能初创公司 Liquid AI 今日正式发布并开源了全新的端侧大模型
LFM2.5-8B-A1B
。该模型专为消费级硬件的工具调用和复杂指令遵循而设计,在保持极低计算成本的同时,显著提升了端侧设备的推理性能。
在架构上,该模型采用了稀疏混合专家(MoE)设计,总参数量为 8.3B。得益于这种稀疏性,模型在每个 Token 生成时仅激活 1.5B 参数,这使得它能够流畅地在手机及笔记本
电脑
等本地设备上运行。
长文本扩展与推理能力升级
相比前代产品,LFM2.5 将上下文窗口从 32K 大幅扩展至
128K
词元,预训练数据量也从 12T 提升至 38T。作为一款纯推理模型,它会在输出最终答案前生成显式的思维链,且其高压缩率的词表能更高效地处理中文、阿拉伯文等九种语言。
为了解决长推理中的逻辑死循环与幻觉问题,开发团队在训练中引入了两阶段强化学习(RL)。其中,偏好优化有效减少了长链路推理中的"死循环",而专门的防幻觉奖励机制则让模型在面对超出知识库的问题时能够主动拒绝回答。
端侧性能强劲与生态全面兼容
在性能表现上,LFM2.5 实现了爆发式增长,其在逻辑推理与反幻觉基准测试中的得分大幅超越前代,甚至在指令遵循上媲美更大参数量的模型。在工具调用方面,模型默认输出高效的 Python 函数调用,并支持在系统提示词中无缝切换为 JSON 格式。
该模型在发布首日便获得了主流推理生态的全面支持,包括 llama.cpp、MLX、vLLM 和 SGLang。在硬件实测中,它在 M5 Max 芯片上的解码速度高达每秒 253 字节,而在手机端也能达到每秒约 30 字节。
文章来源:
AIBase
| 版权归原作者所有,如有侵权请联系删除
回复
转播
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
返回列表
发新帖
回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
xiaoye
楼主
Lv.9 管理员
主题
回帖
0
积分
20071
+ 关注
发消息
2025年最靠谱的5大汽车服务获客渠道,第4个90%的人不知道!
2026-06-04
老板说996是福报,95后直接掀了桌子……
2026-06-04
老板说电车冲击大,他靠AI获客,3个月客户翻5倍!
2026-06-04
反常颠覆 → 别再盲目投广告了!这3个获客秘籍,让汽车服务行业客户暴涨
2026-06-04
汽车服务行业如何获客?这3个方法让客户主动找上门!
2026-06-04
更多作者好帖
Fashion 热点
拥抱AI搜索新时代!GEO优化成为企业流量增
404
网络资讯
GEO优化如何让企业流量翻倍?
303
网络资讯
GEO优化,企业抢占流量高地的制胜法宝
303
网络资讯
Vogue 新鲜事
GEO 优化:解决商家 “获客难” 的新解法,2025 年流量争夺的关键
香港站群服务器做业务的五大核心优势,ES机房助力出海稳赢
揭秘!这3家外卖代运营公司,为何能让店铺月销暴涨10倍
震惊!这 5 个戒网瘾机构凭啥能上排行榜,你知道吗?
ES机房:美国服务器建站的核心优势
外卖代运营公司鱼龙混杂,这5家靠谱公司你不能错过!
十大戒网瘾基地真实口碑排行,哪家最靠谱?
2025年电子电器行业AI获客实测:第3招90%的人不知道!
上一主题
下一主题
浏览过的版块
GEO实战
知识问答
得知互动是一个融创意、设计、开发、营销、生活、互联网于一体的专业交流分享平台。
快捷导航
道具
举报与投诉
Archiver
小黑屋
Copyright © 2026
站长技术交流论坛|互联网技术交流平台
版权所有
All Rights Reserved.
Powered by
Discuz!
X5.0
鄂ICP备15006301号-5
|
鄂公网安备 42018502006730号
首页
论坛
发布
消息
我的
关灯
在本版发帖
扫一扫添加QQ客服
返回顶部
快速回复
返回顶部
返回列表