数智合作中心 · 人工智能数据能力
真实世界多模态行为数据的高质量供给与场景赋能
面向具身智能、世界模型、多模态大模型、生成式视频与智能语音等前沿方向,提供从真实场景采集、标注前置、质量校验到数据交付的全流程能力。
19 年扎根音视频真实世界采集与专业生产
百万+多模态数据对持续沉淀
采标一体从采集阶段落实标注规范与质量控制
场景赋能服务具身智能、世界模型、生成式视频等训练需求
代表性数据产品
核心数据集产品 × 深度场景赋能
围绕具身智能、世界模型、生成式视频与智能语音等方向,沉淀可验证、可交付的代表性数据产品。
高清连续多视角4D视频数据集
支持 VLM 预训练 · 动作识别 · 行为预测 · 场景理解
数据规格
- 6视角以上同步拍摄,帧级同步技术确保严格对齐。
- 统一时间码,场景-动作-人物-机位多级数据结构。
- 覆盖多场景多人交互行为,包含4D时空序列。
标注精度
- 拍摄场景点云重建,高精度点云图与相机姿态位。
- 人物交互关系语义标注、场景类别标注。
深度赋能场景
具身智能:让机器看懂人的世界。
世界模型:构建物理世界的数字镜像。
生成式视频:学习真实世界的镜头语言。
复杂环境声事件解析数据集
支持音频大模型 · 声音事件检测 · 语音识别 · 多模态对齐
数据规格
- 城市街区、办公环境、公共场所等多场景采集。
- 多声源叠加事件采集,真实还原复杂声学环境。
- 48kHz高保真采样,覆盖全频段声音事件。
标注精度
- 声源分类标注。
- 事件时间定位,毫秒级精度。
- 说话人分离与语音转写对齐。
深度赋能场景
具身智能:让机器听懂复杂指令。
智能安防:听得见的预警系统。
音频大模型:理解声音的世界。
视频编辑数据集
支持文生视频 · 视频理解 · 场景理解
数据规格
- 覆盖增、删、改三种核心编辑操作。
- 文本指令驱动,自然语言描述编辑意图。
- 元素级编辑,人物、服饰、配饰、道具精准定位。
标注精度
- 目标对象像素级分割标注,Mask级别。
- 编辑前后状态帧级对应标注。
- 文本指令与视觉操作多模态对齐。
深度赋能场景
视频内容生成:理解元素级编辑指令。
智能换装:视频中任意元素的替换与生成。
影视后期智能化:元素增删改的智能流程。
第一视角手部物理交互操作数据集
支持机器人操作训练 · 灵巧手控制 · AR/VR交互 · 物理仿真
数据规格
- 3D骨骼关键点追踪,手部21+关键点。
- 物理引擎仿真验证。
- 覆盖刚性、柔性物体抓取、推拉等交互。
标注精度
- 手部姿态标注。
- 物体状态变化全程追踪。
- 精确的时序手部事件标注。
深度赋能场景
具身智能:从笨拙到灵巧的跃迁。
AR/VR:自然交互的未来。
工业自动化:精细化操作的数据基石。
数据底座
面向模型训练的真实世界多模态数据资源
依托中广天择在真实世界音视频采集、专业生产与多模态对齐上的长期积累,持续沉淀视频、音频、文本、空间几何与行为语义等可用于模型训练的数据资产。
数据类型高覆盖
4D 时空序列
多视角超高清视频
空间几何数据
人体行为结构化数据
行为语义文本
同步音频
物理交互
场景事件
模态覆盖视频、音频、文本、3D、关键点、轨迹等数据形态可组合交付。
场景覆盖覆盖运动行为、手部交互、声音事件、视频编辑与真实环境理解等方向。
标注颗粒度支持从片段级、事件级到关键点级的多层级结构化标注。
能力沉淀
百万级视频-音频-文本-3D全对齐的多模态数据对持续沉淀
百亿级音视频训练数据 token,来源于4K超高清视频序列与48kHz高保真音频资源
持续增长覆盖人体行为、物体交互、环境动态和行为语义等真实世界数据
创新引擎
“标注前置”的高质量生产体系
从“先采后标”转向“采标一体”,在采集阶段即按标注规范执行,降低返工成本,提高数据可用性与交付效率。
环节 01垂类场景策划围绕模型训练目标设计场景与任务。
环节 02专业级采集控制机位、音频、环境与交互过程。
环节 03标注前置采集阶段同步落实标签和规范。
环节 04精加工完成对齐、切片、结构化与语义整理。
环节 05质量校验多轮质检保障数据准确性和一致性。
环节 06数据交付按训练任务提供对应精度与格式。
质量更高
采集阶段即按标注规范执行,确保数据从源头具备可用性。
算法辅助能力
以算法辅助采标一体和质量控制
围绕采集、标注、结构化、对齐和质检等关键环节,构建贯穿数据生产流程的算法辅助能力,支撑高质量数据交付。
采集辅助
围绕机位、画面、声音、动作和环境状态,辅助采集过程中的质量判断与过程校验。
标注辅助
辅助完成事件定位、行为切分、关键点识别、语音转写、声源分类等多层级标注任务。
多模态对齐
支撑视频、音频、文本、空间数据与行为语义之间的时间同步和结构化对应。
质量校验
结合人工复核与算法检测,对数据一致性、完整性、准确性和可用性进行多轮校验。
相关能力持续迭代扩展,重点服务于数据产品化、定制化交付和客户训练任务适配。
定制化数据服务
面向客户训练目标的定制化数据解决方案
基于真实世界多模态数据采集、采标一体生产体系与算法辅助能力,可围绕客户模型训练目标扩展场景、模态、标注体系与交付规格。
以产品能力承接多样化训练需求
围绕模型训练任务,组合已有数据资产、采集生产体系和算法辅助能力,形成适配客户场景的数据服务方案。
场景定制
围绕客户模型任务设计采集场景,扩展至体育赛事、工业操作、家庭服务、影视内容、机器人训练等方向。
标注定制
按训练目标定制标签体系、标注颗粒度和质检标准,支持从事件级、镜头级到关键点级的多层标注。
模态扩展
可组合视频、音频、文本、3D、点云、关键点、轨迹、事件等多模态数据,支撑不同模型训练需求。
交付定制
根据客户训练格式、数据规模、质量标准和交付周期要求,形成可验证、可复用的数据交付方案。
近期推荐
近期推荐数据产品样例
围绕近期重点需求,选取具有代表性的典型数据产品,展示公司在复杂真实场景采集、标注、质检与多模态对齐方面的综合能力。
音画同步与说话人标注数据
适用于多模态大模型的视频理解、音画对齐、多人场景识别与环境声理解。
多模态理解样例
第一视角双手操作数据
适用于具身智能训练,体现真实操作、动作关键点、物体交互与任务流程。
具身智能样例
多视角真实运动数据
适用于运动智能、动作识别、轨迹分析与多机位同步理解。
复杂场景样例
实时双向语音对话数据
适用于语音助手、双工 TTS、ASR 与自然对话系统训练。
智能语音样例
以真实世界数据支撑智能落地
持续沉淀多模态数据资源,完善采标一体生产体系,面向不同模型训练任务提供可验证、可交付的数据服务。
查看定制服务