首页 > 新闻中心 > 掌酷科技 > 互联网 >

小鹏汽车首席科学家郭彦东:造更懂中国人的智(4)
2018-07-29 16:03 钛媒体APP

我可以和大家分享一个更细节的数字,我们也跟很多技术供应商去探讨,一些很顶级的技术供应商,可能一年收集10个亿的图片,但是这个图片的量对于互联网数据来说,可能是一周,甚至远远不到一周的时候,互联网上就有这么多图片产生了。这个做过搜索引擎的人最有体会的,包括我自己。

互联网数据量非常之大,对早期算法的演进意义重大。但是它有它的挑战,就是说,这部分数据可能跟无人驾驶、智能车想要的数据分布有一些不一样的地方,标注也有一些困难,需要用一些办法,比如迁移学习把互联网的知识转移到智能车上去。

为了达到这样的一个目的,我们也关注另外3个主要数据来源:1、仿真大数据。2、自有车队数据。3、来自于用户的真实数据。

尤其是中国用户的真实数据,不管从真实度上,还是成本效率上,还是对场景的覆盖度、数据量上,都远远的优于仿真和自有车队的数据体量。在人工智能尤其是深度学习的大环境下,其实谁坐拥了数据,谁就有可能会有最先进、最完善的技术体系。这个也是整车厂商有的一个优势。我们从大量的用户中搜集用户的反馈,用这个数据不停的调教和更新我们的智能车系统。

第二,我们有了数据以后,如何去做。我们搭建人工智能平台,用大量的数据训练多个深度学习模型。

但是,我们想强调的是在智能车的场景中,往往最有价值的就是所谓的长尾(long-tail)数据。就是说这些数据发生的频次很低,很有可能你开很久的车才会有一次、两次发生,但是这些事情的种类、类别、数量会非常多,想要让我们的车辆适应尽可能多的场景,就要求我们的人工智能平台有快速处理这样一个长尾(long-tail)数据的能力。

这有几个挺有意思的例子,比如我从加州回来之前在路上。因为天气也很好,前面是一个油罐车,这个油罐车很干净,它把后面的车,包括我自己的车倒影在油罐车的油罐上面去了。

如果你对这个场景没有一个特殊的理解和处理的话,很多世界上最好的计算机视觉算法,都有可能误认为倒影是真实的车道线与车辆。

特斯拉曾经发生过一件很惨痛的事故,特斯拉的车没有成功的把一辆白色的大货车认成车,认为是一片云彩,也撞上去了。

右下角就更有意思了,尤其是坐在前排的观众,可以马上发现,这其实是一个披着cosplay衣服的行人走在路上,人类司机都可以完成识别是一个行人。但是计算机视觉,由于这个人穿了一件cosplay的衣服,可能算法不一定能成功检测到是一个人。

标签: 人工智能 特斯拉 智能 数据 驾驶
0

上一篇:女孩们的专属2号男友:美图T9登陆台湾
下一篇:没有了
官方微信公众号:掌酷门户(wapzknet)

首页 > 新闻中心 > 掌酷科技 > 互联网 >
相关资讯

新闻热点
精选美图


客户端合作免责友链
Copyright 2009-2017 冀ICP备09035849号-1
掌酷门户 版权所有 冀公网安备 13092302000152号