数据开放与分享倡议

一、Apollo宣言

开放能力 共享资源 加速创新 持续共赢

二、数据共享

1. 公平数据原则

  • •  在数据开放规模方面,以“贡献越多收获越大为原则”。
  • •  合作伙伴贡献以数据里程(公里)为单位进行核算。
  • •   收获指合作伙伴在Apollo数据开放平台(以下简称“平台”)可以获取的数据、服务和算法模型等。

2. 数据存储原则

•  所有在中国境内采集的数据,必须且只能保存在中国境内的服务器上;采集自其它国家和地区的数据,也必须遵照相关国家法律关于数据存储方面的规定。

3. 数据的提供

  • •  所有数据均需以符合Apollo数据规范的形式上传。

4. 初始数据与后续数据

  • •  百度作为平台的发起者,为平台提供初始数据。这部分数据将对平台的所有合作伙伴开放。
  • •  初始数据之后,平台将依靠平台全体合作伙伴的贡献逐步成长。每位合作伙伴都应遵循公平数据原则。

5. 数据加工

  • •  平台有权对合作伙伴上传并标记为公开的数据进行加工处理,处理后的数据将作为本平台的公开数据。

6. 数据隐私

  • •  任何合作伙伴可以查看自己的数据,并设定数据的隐私属性为:私有或公开。
  • •  私有:表示该数据只能由合作伙伴自己查看和使用。
  • •  公开:表示将该数据授权给本平台,本平台将根据平台的数据共享原则公开衍生的数据和资源。
  • •  合作伙伴上传的数据默认为该合作伙伴私有;平台在合作伙伴上传且标记为公开的数据基础上经过二次加工的数据(如:标注或场景提取)需要作为平台公开数据。
  • •  黑名单:如果合作伙伴不希望自己的数据被某个敏感合作伙伴访问,则可以进行设定。
  • •  特殊数据:默认为合作伙伴私有数据。该数据的拥有者可以指定将其开放给平台的特定合作伙伴。

7. 数据访问

  • •  合作伙伴可以利用本平台进行数据查看。
  • •  合作伙伴可以在本平台上训练自己的模型,在训练中通过平台API存取数据。
  • •  合作伙伴在模型训练过程中产生的“本倡议之外的”计算过程数据由合作伙伴自身拥有。

8. 计算结果

  • •  合作伙伴利用本平台和数据计算后得到的“计算结果”(如:计算过程数据、计算结果、日志、数据模型等)归该合作伙伴所有,可以从平台自由下载。其它合作伙伴均不可见且无法访问。

三、数据范围与开放方法

1. 数据内容

1) 原始数据

指车辆行驶过程中产生的传感器数据、驾驶行为数据、定位数据等。

2) 标注数据

指在原始数据基础上,通过人工或机器手段对数据进行标注,如2D/3D车辆标注、行人标注、车道线标注及特殊驾驶场景数据等。

3) 无人驾驶场景(ADS)

  • •  本平台将提供仿真模拟器,以及可在模拟器上运行的各类仿真场景。
  • •  百度智能汽车将作为平台合作伙伴为平台提供首批常见经典场景。
  • •  平台的每位合作伙伴也可以利用模拟器自己编辑场景,或将无人车行驶过程中的场景数据分享给平台。

4) 特殊数据

如:发动机调校表(比如踩多少油门能有多大加速度),CAN总线协议等。

2. 开放方法

  • •  每类数据会提供少量Demo数据供合作伙伴下载到本地调试程序。
  • •  标注数据和无人驾驶场景(ADS):合作伙伴可以通过本平台对数据进行在线查看,或将算法程序部署到平台,通过本平台API对数据进行调用。
  • •  特殊数据平台仅提供查看功能,不提供API访问和下载。

四、数据贡献

平台的成长有赖于平台全体合作伙伴的共同努力。在访问平台提供的公开数据的同时,我们也将非常欢迎每位合作伙伴积极在平台分享自己的数据。我们将秉承数据公平原则,确保数据贡献越多的合作伙伴也能够从平台获取更多的数据和服务。