W19 AI 数据情报 — 集识光年

一句话速览

模型 + 数据 + benchmark + 移动端 [P0]、Google DeepMind 在 2026-03-11 发布 Gemma 4 全家族，2026-04-08 起开源生态全面改造下游数据栈 [P0]、Anthropic 牵头 Project Glasswing 成立跨大厂 AI 安全联盟，2026-04-09 更新 Claude API release notes [P1]。本周最强数据需求信号：野外 3D 检测与立体深度数据。

Key Findings

本周 5 条高商业价值发现

P0 Allen AI 在 2026-04-04 至 2026-04-07 把 WildDet3D 做成「野外 3D 检测」完整栈：模型 + 数据 + benchmark + 移动端 [P0]

Allen AI 从 2026-04-04 起连发 WildDet3D 系列：2026-04-04 上线 `allenai/WildDet3D` 模型（open-vocabulary monocular 3D detection，当前下载量 34、likes 12）；2026-04-05 发布 `allenai/WildDet3D-Data`（训练集含 human-reviewed 3D bounding box 标注）；2026-04-06 发布 `allenai/WildDet3D-Stereo4D-Bench`（用 Stereo4D 视频生成的立体深度 ground-truth 评测集）；2026-04-07 一天内连发 `allenai/WildDet3D-visualization-source`（下载量已到 4,177）、`allenai/WildDet3D-Bench`（val 集 2,470 图、9,256 标注，785 类，test set 隐藏评测）、`allenai/WildDet3D-iPhone` 模型。Allen AI 官方博客同步推送《Introducing WildDet3D: Open-world 3D detection from a single image》。

商业意义 → Allen AI 的打法完全复制 MolmoWeb 模式——不是扔一个数据集或一个模型，而是"开源模型 + 人工验收训练数据 + val 公开 + test 隐藏 + 移动端变体"一整套发布。对数据服务公司而言，这条产线真正稀缺的节点是：785 类 in-the-wild 的 3D bounding box 人工复核、单目 → 立体深度对齐、以及 iPhone 端真实场景的标注回流。单目 3D 检测过去是自动驾驶专属，现在被 Allen AI 押到了"任意 RGB 图 → 3D"的通用场景，判断密集型的 3D 标注需求会显著抬升。

P0 Google DeepMind 在 2026-03-11 发布 Gemma 4 全家族，2026-04-08 起开源生态全面改造下游数据栈 [P0]

`google/gemma-4-31B-it` 当前下载量 1,589,761、likes 1,595，`google/gemma-4-26B-A4B-it` 下载 1,269,031、likes 575，`google/gemma-4-E4B-it` 与 `google/gemma-4-E2B-it` 分别为 961,135 与 646,063 下载，全部走 image-text-to-text 或 any-to-any pipeline；DeepMind 博客以《Gemma 4: Byte for byte, the most capable open models》为题，强调 Gemma 4 面向 reasoning 和 agentic workflows。NVIDIA 同时上线《From RTX to Spark: NVIDIA Accelerates Gemma 4 for Local Agentic AI》，把 Gemma 4 做成 RTX 本地 Agent 的首发承载；Hugging Face 官方博客同步发了《Welcome Gemma 4》。

商业意义 → Gemma 4 是本周体量最大的开源动作，但真正的数据信号不在模型本身，而在它带动的下游：任何对 Gemma 4 做 SFT / 偏好对齐 / Agent 能力注入的团队，都会立即面临"哪里找多模态 + reasoning + tool-use 配套语料"的问题。这正是集识光年和专家数据服务可以切入的窗口——不是做 pretrain 语料，而是做 Gemma 4 规模下的 post-training 评测集、工具调用轨迹、多模态偏好样本。

P1 Anthropic 牵头 Project Glasswing 成立跨大厂 AI 安全联盟，2026-04-09 更新 Claude API release notes [P1]

Anthropic 官网新闻页推出 Project Glasswing，参与方包含 AWS、Anthropic、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorgan Chase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks，是目前参与方最完整的 AI 安全联盟之一；同时 Anthropic Research 同期刊出《Emotion concepts and their function in a large language model》研究；`Anthropic/EconomicIndex` 数据集当前下载量 13,125、likes 498，较上期继续增长。Claude API 在 2026-04-09 发布新的 release notes。

商业意义 → 大厂正在把"AI 安全 + 使用数据治理"从单点研究变成基础设施层面的联盟游戏。对数据服务公司，这意味着未来做红队测试、用户行为审计、合规数据标注的准入门槛会同时变高和变集中。Economic Index 这类"真实经济活动被 AI 分摊的轨迹数据"会越来越像一类独立资产。

P1 NVIDIA Physical AI 与 LeRobot 继续领跑具身数据，下载量本周再次放量 [P1]

`nvidia/PhysicalAI-Robotics-Open-H-Embodiment` 当前下载量 72,898、likes 18（较 2026-03-28 的 51,101 上涨 42.9%）；`nvidia/PhysicalAI-Autonomous-Vehicles` 已到 1,006,425 下载、likes 826；`nvidia/SEED-Timeline-Annotations`（BONES-SEED 人体动作时序标注）同步推出。LeRobot 生态在本周放出 `lerobot/droid_1.0.1`、`lerobot/openarms-hardware-modifications` 以及 `OpenDriveLab/WorldEngine`，其中 droid_1.0.1 直接指向 LeRobot 主生态。NVIDIA Robotics Blog 配合 National Robotics Week 发《Latest Physical AI Research, Breakthroughs and Resources》。AGIBOT 也在 Robot Report 上公开 GO-2 foundation model 与 Genie Sim 3.0 仿真平台。

商业意义 → 机器人数据这条线从 2026-02 起一直没有降温的迹象，真实 embodiment 数据的周增长仍然在 30%-50% 区间。这说明合成数据和仿真不但没有替代真实示范，反而抬高了"真实示范 + 可验证动作边界 + 连续时序标注"的单价。对集识光年，机器人遥操作、示范分段与复核、sim-to-real 验证样本依然是最值得押注的具身数据方向。

P2 本周论文集中指向一个结论：Reward Model 本身正在被迫进化，而训练数据的"可控合成"成为新通路 [P1]

本周 arXiv 和 Hugging Face Papers 集中涌现多篇 reward model 相关论文：2026-04-08 `ConsistRM: Improving Generative Reward Models via Consistency-Aware Self-Training`、2026-04-08 `ReflectRM: Boosting Generative Reward Models via Self-Reflection within a Unified Judgment Framework`、2026-04-07 `VL-MDR: Dynamic Dimension Selection and Aggregation for Interpretable Vision-Language Reward Modeling`、2026-04-09 `ProMedical: Hierarchical Fine-Grained Criteria Modeling for Medical LLM Alignment via Explicit Injection`、2026-04-06 `SenseAI: A Human-in-the-Loop Dataset for RLHF-Aligned Financial Sentiment Reasoning`、以及 2026-04-09 `Aligning Agents via Planning: A Benchmark for Trajectory-Level Reward Modeling`。更关键的两篇是 2026-04-09 `Synthetic Data for any Differentiable Target`（提出 Dataset Policy Gradient, DPG，可以用 RL 精确优化合成数据生成器产出目标样本）和 2026-04-09 `Structured Distillation of Web Agent Capabilities Enables Generalization`。

商业意义 → 学术界本周给出了两条非常一致的信号：一是 reward model 不再是一个标量打分器，而要往"可自我一致""多维分解""可解释"的方向走；二是合成数据开始被当作"可微目标"来控制，而不是靠 prompt 撞大运。这两个趋势对数据公司的含义正好相反——reward model 的升级会抬升"高维人类判断"的单价，但 DPG 类方法会把纯合成数据的 marginal value 继续压低。集识光年应该继续用"人工判断 + 可验收反馈"堵住合成数据最后一公里。

Demand Signals

从模型发布反推训练数据需求

野外 3D 检测与立体深度数据

极强 ↑ 新增

Allen AI WildDet3D 系列一周内发布 5+ 资源，val/test 分开，强调人工 review

具身遥操作与机器人示范数据

极强 ↑ 新增

Open-H-Embodiment 下载 72,898，LeRobot 生态同步扩张

长视频与时序动作标注

极强 ↑ 新增

SEED-Timeline-Annotations 与 BONES-SEED 持续扩容；Meta gistbench 强调长时用户理解

Agentic coding / Terminal Agent 轨迹

极强 ↑ 新增

GLM-5 在 Terminal Bench 2.0 达到开源 SOTA；Arcee Trinity-Large-Thinking 强调 tool-calling

多维度 Reward Model 训练数据

极强 ↑ 新增

ConsistRM / ReflectRM / VL-MDR / ProMedical / SenseAI 同周多篇论文

可控合成数据生成配方

强 ↑ 新增

DPG: `Synthetic Data for any Differentiable Target` 把合成数据当作可微目标优化

多模态 Agent 能力蒸馏数据

强 ↑ 新增

`Structured Distillation of Web Agent Capabilities Enables Generalization`

企业级多语种语音基座数据

强 ↑ 新增

面壁 VoxCPM 2 支持 30 国语种 + 9 大方言；Mistral Voxtral TTS；Deepgram 接入 Together

Economic Index 类真实使用轨迹

中 ↑ 新增

Anthropic EconomicIndex 当前下载 13,125，持续成为独立资产

医疗/金融垂域 RLHF 精标

中 ↑ 新增

ProMedical + SenseAI 指向"高价值垂域"的 human-in-the-loop 数据服务

网页动作轨迹数据 ↓ 退出上期出现，本期未出现

GUI grounding / Screen parsing 数据 ↓ 退出上期出现，本期未出现

Computer Use 连续视频示范 ↓ 退出上期出现，本期未出现

代码 Agent / 终端后训练语料 ↓ 退出上期出现，本期未出现

机器人遥操作与具身示范数据 ↓ 退出上期出现，本期未出现

长视频推理与长时序多模态数据 ↓ 退出上期出现，本期未出现

隐式偏好与真实使用反馈数据 ↓ 退出上期出现，本期未出现

多域混合 SFT 数据 ↓ 退出上期出现，本期未出现

视觉 Agent benchmark ↓ 退出上期出现，本期未出现

语音到执行链路数据 ↓ 退出上期出现，本期未出现

Download Movers

本周下载量变化最大的数据集

数据集	下载量	周增长
allenai/MolmoWeb-SyntheticTrajs	1,159	+155.3%
allenai/MolmoWeb-HumanTrajs	769	+92.7%
nvidia/PhysicalAI-Robotics-Open-H-Embodiment	72,898	+42.7%
Anthropic/EconomicIndex	13,125	+11.9%
google/WaxalNLP	11,831	-14.9%

想深聊本期内容？

Kai Founder & CEO

苏文 AI 文档与发布工程师

陆明哲 AI 产品经理

由 AI Dataset Radar 自动生成 · 每周更新

AI Dataset Radar →

Allen AI 把野外 3D 检测做成完整栈Gemma 4 带动开源 Agent 生态全面换挡

Key Findings

Demand Signals

Download Movers

Allen AI 把野外 3D 检测做成完整栈
Gemma 4 带动开源 Agent 生态全面换挡