Allen AI 撤下 29 个视频追踪
AI 数据行业周度洞察
本周扫描 86 个 HF 组织 · 50 个 GitHub 组织 · 71 个博客 · 125 个 X 账户
Allen AI 撤下 29 个视频追踪数据集,释放视频理解数据紧缺信号 [P0]、编码 Agent 轨迹数据成稀缺资源,TogetherAI 撤下 CoderForge-Preview 数据集 [P0]、中国具身智能数据集 BAAI/ToucHD 系列被撤回,触觉数据成新蓝海 [P1]。本周最强数据需求信号:视频理解/追踪数据。
Key Findings
本周 5 条高商业价值发现
Allen AI 在 3 月 5 日突然撤下 Molmo2 系列全部 29 个视频数据集,包括 VideoLocalizedNarratives、VideoMME、TVQA 等核心视频理解基准。这些数据集原本用于训练其多模态模型的视频追踪和理解能力。同期 NVIDIA 新增 Isaac-GR00T (6,321 星) 等具身智能仓库,显示行业正在争夺视频-动作对齐数据。
TogetherAI 在 3 月 5 日撤下 CoderForge-Preview 数据集,该数据集包含高质量的编码 Agent 执行轨迹。同期 OpenAI 发布 codex 仓库(63,080 星),Anthropics 的 claude-code 达到 73,813 星。论文《A Rubric-Supervised Critic from Sparse Real-World Outcomes》(2026-03-04) 提出从稀疏的人类交互中学习评估模型。
北京智源(BAAI)撤下 ToucHD-Force、ToucHD-Mani、ToucHD-Sim 三个机器人触觉数据集(2026-03-05)。这些数据集原本包含机器人操作中的力反馈和触觉信息。NVIDIA 同期发布 PhysicalAI-Robotics-NuRec 和 Arena-GR1-Manipulation 数据集,显示触觉模态成为具身智能的关键瓶颈。
EleutherAI 撤下 djinn-problems-v0.9 和 rh-misalignment-control-sft 数据集。NVIDIA 的 SPEED-Bench、Microsoft 的 TestExplora 等评估基准同时被撤下。论文《QEDBENCH: Quantifying the Alignment Gap》(2026-02-24) 显示学术界正在建立更严格的模型对齐评估标准。
论文《JANUS: Structured Bidirectional Generation》(2026-03-04) 提出同时解决 Fidelity(保真度)、Control(逻辑约束控制)、Reliability(不确定性估计)和 Efficiency(计算效率)的框架。SuperAnnotate 发布 MCP Server 工具,支持 AI agents 直接连接标注项目。
Demand Signals
从模型发布反推训练数据需求
Deep Dive — DataRecipe
本周 3 个高价值数据集逆向分析(由 DataRecipe 自动生成)
数据结构
风险评估
数据结构
风险评估
数据结构
风险评估
本周共分析 3 个数据集 · 人工占比 99.6%
想深聊本期内容?
由 AI Dataset Radar 自动生成 · 每周更新
AI Dataset Radar →