玩球体育在线(中国)唯一官方网站

设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

Meta 开源 MobileLLM-R1 系列小语言 AI 模型:参数量不到 10 亿、专攻数学编程科学问题

2025/9/22 20:04:50 来源:IT之家 作者:漾仔 责编:漾仔

IT之家 9 月 22 日消息,Meta 现已公布了 MobileLLM-R1 系列小语言模型,分别提供 1.4 亿、3.6 亿和 9.5 亿不同参数版本,强调能够在本地移动平台等轻量级设备上运行

Meta 表示,MobileLLM-R1 并不是面向聊天机器人的通用模型,而是经过监督式微调(SFT)专门训练,主要用于解决数学、编程(如 Python、C++)和科学类问题,以最大规模的 MobileLLM-R1 950M 为例,其预训练数据仅使用了约 2TB 高质量 token,总训练数据量也不到 5TB,但表现依然出色。在 MATH、GSM8K、MMLU、LiveCodeBench 等多项基准测试中,成绩超过了使用 36TB token 数据训练的 Qwen 3-0.6B。

在对比现有开源小模型时,MobileLLM-R1 950M 在 MATH 测试中的准确率是 Olmo 1.24B 的 5 倍,也是 SmolLM 1.7B 的 2 倍。在编程任务中,其表现同样优于 Olmo 1.24B 和 SmolLM 1.7B。

目前,开发者可以通过 vLLM 推理引擎运行 MobileLLM-R1,只需在 ModelRegistry 中登记模型架构 Llama4ForCausalLM 即可。该系列模型已以 Apache 2.0 协议开源,并发布在 Hugging Face 平台()。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

玩球体育在线(中国)唯一官方网站相关的文章

关键词:MetaAI 模型

软媒旗下网站: IT之家 最会买 - 返利返现优惠券 Win7之家 Win10之家

软媒旗下软件: 软媒玩球体育在线(中国)唯一官方网站APP应用 魔方