Radar Brief 2026 年第 19 周 · 2026-04-03 — 2026-04-10

Allen AI 把野外 3D 检测做成完整栈
Gemma 4 带动开源 Agent 生态全面换挡

本周扫描 86 个 HF 组织 · 50 个 GitHub 组织 · 71 个博客 · 125 个 X 账户

0
高价值数据集
0
相关论文
0
博客文章
0
活跃仓库
一句话速览

模型 + 数据 + benchmark + 移动端 [P0]、Google DeepMind 在 2026-03-11 发布 Gemma 4 全家族,2026-04-08 起开源生态全面改造下游数据栈 [P0]、Anthropic 牵头 Project Glasswing 成立跨大厂 AI 安全联盟,2026-04-09 更新 Claude API release notes [P1]。本周最强数据需求信号:野外 3D 检测与立体深度数据。

Key Findings

本周 5 条高商业价值发现

P0 Allen AI 在 2026-04-04 至 2026-04-07 把 WildDet3D 做成「野外 3D 检测」完整栈:模型 + 数据 + benchmark + 移动端 [P0]

Allen AI 从 2026-04-04 起连发 WildDet3D 系列:2026-04-04 上线 `allenai/WildDet3D` 模型(open-vocabulary monocular 3D detection,当前下载量 34、likes 12);2026-04-05 发布 `allenai/WildDet3D-Data`(训练集含 human-reviewed 3D bounding box 标注);2026-04-06 发布 `allenai/WildDet3D-Stereo4D-Bench`(用 Stereo4D 视频生成的立体深度 ground-truth 评测集);2026-04-07 一天内连发 `allenai/WildDet3D-visualization-source`(下载量已到 4,177)、`allenai/WildDet3D-Bench`(val 集 2,470 图、9,256 标注,785 类,test set 隐藏评测)、`allenai/WildDet3D-iPhone` 模型。Allen AI 官方博客同步推送《Introducing WildDet3D: Open-world 3D detection from a single image》。

商业意义 → Allen AI 的打法完全复制 MolmoWeb 模式——不是扔一个数据集或一个模型,而是"开源模型 + 人工验收训练数据 + val 公开 + test 隐藏 + 移动端变体"一整套发布。对数据服务公司而言,这条产线真正稀缺的节点是:785 类 in-the-wild 的 3D bounding box 人工复核、单目 → 立体深度对齐、以及 iPhone 端真实场景的标注回流。单目 3D 检测过去是自动驾驶专属,现在被 Allen AI 押到了"任意 RGB 图 → 3D"的通用场景,判断密集型的 3D 标注需求会显著抬升。
P0 Google DeepMind 在 2026-03-11 发布 Gemma 4 全家族,2026-04-08 起开源生态全面改造下游数据栈 [P0]

`google/gemma-4-31B-it` 当前下载量 1,589,761、likes 1,595,`google/gemma-4-26B-A4B-it` 下载 1,269,031、likes 575,`google/gemma-4-E4B-it` 与 `google/gemma-4-E2B-it` 分别为 961,135 与 646,063 下载,全部走 image-text-to-text 或 any-to-any pipeline;DeepMind 博客以《Gemma 4: Byte for byte, the most capable open models》为题,强调 Gemma 4 面向 reasoning 和 agentic workflows。NVIDIA 同时上线《From RTX to Spark: NVIDIA Accelerates Gemma 4 for Local Agentic AI》,把 Gemma 4 做成 RTX 本地 Agent 的首发承载;Hugging Face 官方博客同步发了《Welcome Gemma 4》。

商业意义 → Gemma 4 是本周体量最大的开源动作,但真正的数据信号不在模型本身,而在它带动的下游:任何对 Gemma 4 做 SFT / 偏好对齐 / Agent 能力注入的团队,都会立即面临"哪里找多模态 + reasoning + tool-use 配套语料"的问题。这正是集识光年和专家数据服务可以切入的窗口——不是做 pretrain 语料,而是做 Gemma 4 规模下的 post-training 评测集、工具调用轨迹、多模态偏好样本。
P1 Anthropic 牵头 Project Glasswing 成立跨大厂 AI 安全联盟,2026-04-09 更新 Claude API release notes [P1]

Anthropic 官网新闻页推出 Project Glasswing,参与方包含 AWS、Anthropic、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorgan Chase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks,是目前参与方最完整的 AI 安全联盟之一;同时 Anthropic Research 同期刊出《Emotion concepts and their function in a large language model》研究;`Anthropic/EconomicIndex` 数据集当前下载量 13,125、likes 498,较上期继续增长。Claude API 在 2026-04-09 发布新的 release notes。

商业意义 → 大厂正在把"AI 安全 + 使用数据治理"从单点研究变成基础设施层面的联盟游戏。对数据服务公司,这意味着未来做红队测试、用户行为审计、合规数据标注的准入门槛会同时变高和变集中。Economic Index 这类"真实经济活动被 AI 分摊的轨迹数据"会越来越像一类独立资产。
P1 NVIDIA Physical AI 与 LeRobot 继续领跑具身数据,下载量本周再次放量 [P1]

`nvidia/PhysicalAI-Robotics-Open-H-Embodiment` 当前下载量 72,898、likes 18(较 2026-03-28 的 51,101 上涨 42.9%);`nvidia/PhysicalAI-Autonomous-Vehicles` 已到 1,006,425 下载、likes 826;`nvidia/SEED-Timeline-Annotations`(BONES-SEED 人体动作时序标注)同步推出。LeRobot 生态在本周放出 `lerobot/droid_1.0.1`、`lerobot/openarms-hardware-modifications` 以及 `OpenDriveLab/WorldEngine`,其中 droid_1.0.1 直接指向 LeRobot 主生态。NVIDIA Robotics Blog 配合 National Robotics Week 发《Latest Physical AI Research, Breakthroughs and Resources》。AGIBOT 也在 Robot Report 上公开 GO-2 foundation model 与 Genie Sim 3.0 仿真平台。

商业意义 → 机器人数据这条线从 2026-02 起一直没有降温的迹象,真实 embodiment 数据的周增长仍然在 30%-50% 区间。这说明合成数据和仿真不但没有替代真实示范,反而抬高了"真实示范 + 可验证动作边界 + 连续时序标注"的单价。对集识光年,机器人遥操作、示范分段与复核、sim-to-real 验证样本依然是最值得押注的具身数据方向。
P2 本周论文集中指向一个结论:Reward Model 本身正在被迫进化,而训练数据的"可控合成"成为新通路 [P1]

本周 arXiv 和 Hugging Face Papers 集中涌现多篇 reward model 相关论文:2026-04-08 `ConsistRM: Improving Generative Reward Models via Consistency-Aware Self-Training`、2026-04-08 `ReflectRM: Boosting Generative Reward Models via Self-Reflection within a Unified Judgment Framework`、2026-04-07 `VL-MDR: Dynamic Dimension Selection and Aggregation for Interpretable Vision-Language Reward Modeling`、2026-04-09 `ProMedical: Hierarchical Fine-Grained Criteria Modeling for Medical LLM Alignment via Explicit Injection`、2026-04-06 `SenseAI: A Human-in-the-Loop Dataset for RLHF-Aligned Financial Sentiment Reasoning`、以及 2026-04-09 `Aligning Agents via Planning: A Benchmark for Trajectory-Level Reward Modeling`。更关键的两篇是 2026-04-09 `Synthetic Data for any Differentiable Target`(提出 Dataset Policy Gradient, DPG,可以用 RL 精确优化合成数据生成器产出目标样本)和 2026-04-09 `Structured Distillation of Web Agent Capabilities Enables Generalization`。

商业意义 → 学术界本周给出了两条非常一致的信号:一是 reward model 不再是一个标量打分器,而要往"可自我一致""多维分解""可解释"的方向走;二是合成数据开始被当作"可微目标"来控制,而不是靠 prompt 撞大运。这两个趋势对数据公司的含义正好相反——reward model 的升级会抬升"高维人类判断"的单价,但 DPG 类方法会把纯合成数据的 marginal value 继续压低。集识光年应该继续用"人工判断 + 可验收反馈"堵住合成数据最后一公里。

Demand Signals

从模型发布反推训练数据需求

数据类型 强度 趋势 关联信号
野外 3D 检测与立体深度数据
极强 ↑ 新增
Allen AI WildDet3D 系列一周内发布 5+ 资源,val/test 分开,强调人工 review
具身遥操作与机器人示范数据
极强 ↑ 新增
Open-H-Embodiment 下载 72,898,LeRobot 生态同步扩张
长视频与时序动作标注
极强 ↑ 新增
SEED-Timeline-Annotations 与 BONES-SEED 持续扩容;Meta gistbench 强调长时用户理解
Agentic coding / Terminal Agent 轨迹
极强 ↑ 新增
GLM-5 在 Terminal Bench 2.0 达到开源 SOTA;Arcee Trinity-Large-Thinking 强调 tool-calling
多维度 Reward Model 训练数据
极强 ↑ 新增
ConsistRM / ReflectRM / VL-MDR / ProMedical / SenseAI 同周多篇论文
可控合成数据生成配方
↑ 新增
DPG: `Synthetic Data for any Differentiable Target` 把合成数据当作可微目标优化
多模态 Agent 能力蒸馏数据
↑ 新增
`Structured Distillation of Web Agent Capabilities Enables Generalization`
企业级多语种语音基座数据
↑ 新增
面壁 VoxCPM 2 支持 30 国语种 + 9 大方言;Mistral Voxtral TTS;Deepgram 接入 Together
Economic Index 类真实使用轨迹
↑ 新增
Anthropic EconomicIndex 当前下载 13,125,持续成为独立资产
医疗/金融垂域 RLHF 精标
↑ 新增
ProMedical + SenseAI 指向"高价值垂域"的 human-in-the-loop 数据服务
网页动作轨迹数据 ↓ 退出 上期出现,本期未出现
GUI grounding / Screen parsing 数据 ↓ 退出 上期出现,本期未出现
Computer Use 连续视频示范 ↓ 退出 上期出现,本期未出现
代码 Agent / 终端后训练语料 ↓ 退出 上期出现,本期未出现
机器人遥操作与具身示范数据 ↓ 退出 上期出现,本期未出现
长视频推理与长时序多模态数据 ↓ 退出 上期出现,本期未出现
隐式偏好与真实使用反馈数据 ↓ 退出 上期出现,本期未出现
多域混合 SFT 数据 ↓ 退出 上期出现,本期未出现
视觉 Agent benchmark ↓ 退出 上期出现,本期未出现
语音到执行链路数据 ↓ 退出 上期出现,本期未出现

Download Movers

本周下载量变化最大的数据集

数据集 下载量 周增长
allenai/MolmoWeb-SyntheticTrajs 1,159 +155.3%
allenai/MolmoWeb-HumanTrajs 769 +92.7%
nvidia/PhysicalAI-Robotics-Open-H-Embodiment 72,898 +42.7%
Anthropic/EconomicIndex 13,125 +11.9%
google/WaxalNLP 11,831 -14.9%

想深聊本期内容?

Kai
Kai Founder & CEO
苏文
苏文 AI 文档与发布工程师
陆明哲
陆明哲 AI 产品经理

AI Dataset Radar 自动生成 · 每周更新

AI Dataset Radar →