小鹏汽车首席科学家郭彦东：造更懂中国人的智(4)_手机掌酷门户-http://wapzk.net(已创建9年零1个月)官网

小鹏汽车首席科学家郭彦东：造更懂中国人的智(4)

2018-07-29 16:03 钛媒体APP

我可以和大家分享一个更细节的数字，我们也跟很多技术供应商去探讨，一些很顶级的技术供应商，可能一年收集10个亿的图片，但是这个图片的量对于互联网数据来说，可能是一周，甚至远远不到一周的时候，互联网上就有这么多图片产生了。这个做过搜索引擎的人最有体会的，包括我自己。

互联网数据量非常之大，对早期算法的演进意义重大。但是它有它的挑战，就是说，这部分数据可能跟无人驾驶、智能车想要的数据分布有一些不一样的地方，标注也有一些困难，需要用一些办法，比如迁移学习把互联网的知识转移到智能车上去。

为了达到这样的一个目的，我们也关注另外3个主要数据来源：1、仿真大数据。2、自有车队数据。3、来自于用户的真实数据。

尤其是中国用户的真实数据，不管从真实度上，还是成本效率上，还是对场景的覆盖度、数据量上，都远远的优于仿真和自有车队的数据体量。在人工智能尤其是深度学习的大环境下，其实谁坐拥了数据，谁就有可能会有最先进、最完善的技术体系。这个也是整车厂商有的一个优势。我们从大量的用户中搜集用户的反馈，用这个数据不停的调教和更新我们的智能车系统。

第二，我们有了数据以后，如何去做。我们搭建人工智能平台，用大量的数据训练多个深度学习模型。

但是，我们想强调的是在智能车的场景中，往往最有价值的就是所谓的长尾（long-tail）数据。就是说这些数据发生的频次很低，很有可能你开很久的车才会有一次、两次发生，但是这些事情的种类、类别、数量会非常多，想要让我们的车辆适应尽可能多的场景，就要求我们的人工智能平台有快速处理这样一个长尾（long-tail）数据的能力。

这有几个挺有意思的例子，比如我从加州回来之前在路上。因为天气也很好，前面是一个油罐车，这个油罐车很干净，它把后面的车，包括我自己的车倒影在油罐车的油罐上面去了。

如果你对这个场景没有一个特殊的理解和处理的话，很多世界上最好的计算机视觉算法，都有可能误认为倒影是真实的车道线与车辆。

特斯拉曾经发生过一件很惨痛的事故，特斯拉的车没有成功的把一辆白色的大货车认成车，认为是一片云彩，也撞上去了。

右下角就更有意思了，尤其是坐在前排的观众，可以马上发现，这其实是一个披着cosplay衣服的行人走在路上，人类司机都可以完成识别是一个行人。但是计算机视觉，由于这个人穿了一件cosplay的衣服，可能算法不一定能成功检测到是一个人。

共6页:

标签：人工智能特斯拉智能数据驾驶

上一篇：女孩们的专属2号男友：美图T9登陆台湾
下一篇：没有了

官方微信公众号：掌酷门户(wapzknet)

首页 > 新闻中心 > 掌酷科技 > 互联网 >