Allen AI 连发 4 个 MolmoPoint 数据与模型
细粒度人类判断成多模态 Agent 燃料
本周扫描 86 个 HF 组织 · 50 个 GitHub 组织 · 71 个博客 · 125 个 X 账户
Allen AI 在 2026-03-15 至 2026-03-17 连续发布 4 个 MolmoPoint 相关数据/模型,视频与 GUI 指向数据密集增长 [P0]、NVIDIA 在 2026-03-18 至 2026-03-19 同步公开 RL 与 SFT 训练数据,后训练数据资产化加速 [P0]、NVIDIA 机器人与 Physical AI 数据集下载量继续领跑,遥操作示范成为最强公开需求信号 [P1]。本周最强数据需求信号:视频理解/追踪数据。
Key Findings
本周 5 条高商业价值发现
Allen AI 于 2026-03-15 发布 allenai/MolmoPoint-TrackSyn,下载量 94、likes 2;同日发布 allenai/MolmoPoint-TrackAny,下载量 108、likes 2。2026-03-16 发布模型 allenai/MolmoPoint-8B,下载量 289、likes 11。2026-03-17 发布模型 allenai/MolmoPoint-GUI-8B 和 allenai/MolmoPoint-Vid-4B,下载量分别为 91 和 91。此前相关数据集 allenai/MolmoPoint-GUISyn 于 2026-02-24 发布,下载量 265、likes 6;allenai/Molmo2-VideoPoint 下载量已到 440,较上期 +22。
nvidia/Nemotron-Cascade-2-RL-data 于 2026-03-18 发布,下载量 15、likes 12;nvidia/Nemotron-Cascade-2-SFT-Data 于 2026-03-19 发布,下载量 32、likes 10。对应论文《Nemotron-Cascade 2: Post-Training LLMs with Cascade RL and Multi-Domain On-Policy Distillation》于 2026-03-19 发布。数据描述中明确包含 instruction-following RL、multi-domain RL、on-policy distillation、software engineering RL。同期 nvidia/Nemotron-RL-bixbench_hypothesis 于 2026-03-14 发布,下载量 2,534、likes 4。
nvidia/PhysicalAI-Robotics-Open-H-Embodiment 于 2026-02-06 发布,下载量 37,433、likes 8;nvidia/PhysicalAI-Robotics-Manipulation-Kitchen-Demos 于 2026-02-10 发布,下载量 20,849、likes 38,数据集包含 600 小时人类遥操作示范、316 个任务、55k trajectories。更大规模的 nvidia/PhysicalAI-Autonomous-Vehicles 下载量达到 214,152、likes 785。Meta 侧的 facebook/ego-1k 于 2026-01-29 发布,下载量 5,903,补强 egocentric 3D/multiview 数据。
stepfun-ai/Step-3.5-Flash-SFT 于 2026-03-14 发布,下载量 27,044、likes 260,是本周下载量最高的新 SFT 数据集之一,标签覆盖 chat、sft、instruction-tuning、reasoning、code。InternLM 于 2026-03-12 发布 internlm/VC-RewardBench,下载量 1,810、likes 6,并同步发布 internlm/Visual-ERM 模型,标签直接关联 dataset:internlm/VC-RewardBench。internlm/EndoCoT-Data 于 2026-03-11 发布,下载量 1,764、likes 6,位列本周 Download Movers 第一。
2026-03-19 的《CausalRM》提出从 observational user feedback 学习奖励模型。2026-03-19 的《MOSAIC》讨论多目标 slice-aware iterative curation。2026-03-18 的《Efficient Exploration at Scale》强调 choice data 在线更新。2026-03-17 的《Via Negativa for AI Alignment》指出 negative-only feedback 可逼近或超过标准 RLHF。2026-03-17 的《HIPO》聚焦层级指令服从。同期 Anthropic 发布“81,000 people”大规模用户质性反馈新闻。
Demand Signals
从模型发布反推训练数据需求
Download Movers
本周下载量变化最大的数据集
| 数据集 | 下载量 | 周增长 |
|---|---|---|
| nvidia/HiLiftAeroML | 1,200 | +66.4% |
| laion/majestrino-data | 7,837 | +28.4% |
| allenai/asta-summary-citation-counts | 509 | +11.6% |
| allenai/Molmo2-VideoPoint | 440 | +5.3% |
| internlm/EndoCoT-Data | 1,764 | new |
想深聊本期内容?
由 AI Dataset Radar 自动生成 · 每周更新
AI Dataset Radar →