视觉-语言-动作 · Allen Institute for AI
MolmoAct2:面向真实机器人的开源动作推理模型
MolmoAct2 是开源视觉-语言-动作栈,先在 3D 空间推理再动手。真实 DROID 成功率 87.1%,领先第二名 38.7 个点,推理模型 Molmo2-ER 还超过 GPT-5。
机构
西雅图的非营利 AI 研究机构,OLMo、Molmo 等开源模型的缔造者,专注开放、可复现、服务公众的人工智能。
视觉-语言-动作 · Allen Institute for AI
MolmoAct2 是开源视觉-语言-动作栈,先在 3D 空间推理再动手。真实 DROID 成功率 87.1%,领先第二名 38.7 个点,推理模型 Molmo2-ER 还超过 GPT-5。