NVIDIA视频基准两周增至2479下载
视频场景判断成为新数据高地
本周扫描 86 个 HF 组织 · 50 个 GitHub 组织 · 71 个博客 · 125 个 X 账户
NVIDIA 的 PhysicalAI-VANTAGE-Bench 在 2026-05-04 发布后 14 天内达 2,479 次下载,Subset 版在 2026-05-05 发布后达 1,284 次下载 [P0]、LAION 在本期新增 16 个 rl_environment、4 个 reward_model、1 个 rlhf_preference 数据集,形成成体系对齐数据堆栈 [P0]、Meta 与 Google 同步强化多语言质量数据,facebook/bouquet 与 google/fleurs 分别达到 1,435 和 57,173 次下载 [P1]。本周最强数据需求信号:固定机位视频理解/跨镜头追踪数据。
Key Findings
本周 5 条高商业价值发现
nvidia/PhysicalAI-VANTAGE-Bench 于 2026-05-04 发布,当前下载量 2,479、点赞 9;nvidia/PhysicalAI-VANTAGE-Bench-Subset 于 2026-05-05 发布,当前下载量 1,284、点赞 1。变化追踪显示 VANTAGE-Bench 较上期从 19 增至 2,479,增加 2,460 次、增长 12,947.4%;Subset 从 6 增至 1,284,增加 1,278 次、增长 21,300.0%。两者都聚焦固定基础设施摄像头视频理解任务,覆盖 warehouse、smart city 等真实场景。
变化数据中,rl_environment 从 1 个升至 16 个,新增 15 个;reward_model 从 0 个升至 4 个;rlhf_preference 从 0 个升至 1 个。代表性数据集包括 laion/nemotron-gym-safety、laion/nemotron-gym-agent-workplace、laion/nemotron-gym-agent-calendar、laion/nemotron-gym-competitive-coding、laion/scaling-laws-for-comparison-full,以及 laion/mix_h10_reward_binary-v2、laion/mix_h10_reward_proportional-v2、laion/mix_h10_reward_staged-v2、laion/mix_baseline_uniform-v2,均在本期新出现。
facebook/bouquet 于 2025-06-10 发布,当前下载量 1,435、点赞 36,是 8 种语言的多向并行翻译质量评测集,底层文本由语言学家手工制作;google/fleurs 于 2022-04-19 发布,当前下载量 57,173、点赞 402,覆盖 102 种语言语音识别,标签同时包含 expert-generated、crowdsourced 与 machine-generated。二者共同指向多语言语音/翻译质量评测而非单纯语料扩容。
internlm/WildClawBench 于 2026-03-24 发布,当前下载量 8,250、点赞 59,较上期 7,683 增长 567 次。变化数据还显示 microsoft/Orchard 新增下载量 166、点赞 8,microsoft/WebTailBench 新增下载量 366、点赞 16,均被归入 agent_tool。Databricks 的 databricks/officeqa 于 2025-12-15 发布,当前下载量 131,聚焦真实文档上的端到端推理。
allenai/olmoearth-paper-embeddings 于 2026-05-15 发布,当前下载量 2,876、点赞 2,提供 26 个 Earth observation foundation models 在 24 个下游任务上的论文嵌入;databricks/officeqa 于 2025-12-15 发布,当前下载量 131,围绕 1930 年代起美国财政公报文档上的 grounded reasoning。与此同时,Microsoft Research 在 2026-05-14 发布 SocialReasoning-Bench 相关博客,强调代理虽能执行但未必持续改善用户处境。
Demand Signals
从模型发布反推训练数据需求
Download Movers
本周下载量变化最大的数据集
| 数据集 | 下载量 | 周增长 |
|---|---|---|
| nvidia/PhysicalAI-VANTAGE-Bench-Subset | 1,284 | +21300.0% |
| nvidia/PhysicalAI-VANTAGE-Bench | 2,479 | +12947.4% |
| laion/Scientific-Summaries | 34,214 | +1241.7% |
| microsoft/delulu-fim-benchmark | 659 | +112.6% |
| internlm/WildClawBench | 8,250 | +7.4% |
想深聊本期内容?
由 AI Dataset Radar 自动生成 · 每周更新
AI Dataset Radar →