星行科技周光:用多传感器融合技术 打造有中国特色的无人驾驶解决方案

能见App 2018年6月21日 519

“GIV全球智能汽车前沿峰会”于6月20-21日在深圳隆重举行,本次大会由中国电动汽车百人会主办。大会邀请了行业内专家讨论智能汽车的发展进程与发展路线,研究当前智能汽车核心技术进展与未来发展,并就智能汽车中的5G通信技术与智能汽车测试技术与测试方法、智能汽车的法律法规与标准等核心问题展开研讨。

6月21日以“智能汽车前沿技术 ”为主题的前沿技术与领袖峰会( I) 召开。此会议主要内容包括:智能汽车在环境感知、算法、决策等方面的领先技术;雷达等先进部件;关键芯片技术;智能汽车相关信息安全技术;光学技术及应用;智能驾驶操作系统;先进仿真技术;驾驶行为与心理学研究。

星行科技联合创始人、首席科学家周光出席会议并作主旨演讲。

以下为发言实录:

大家早上好!今天给大家带来的主题是“用多传感器融合技术,打造有中国特色的无人驾驶解决方案”,我是星行科技的联合创始人及首席科学家,我之前是在百度美国团队负责传感器标定、时间同步和感知深度学习算法,之前我们是大疆全球开发者大赛的冠军。

首先跟大家讲一讲无人驾驶到今天分为两个不同的派系,第一种是以科技公司为主导的无人驾驶,以及第二种以OEM以及车厂为主导的无人驾驶,两种不同的公司有着不同的技术路线,车厂出于成本的考虑,还是主导以摄像头等的L3技术,代表的厂商有丰田、日产、戴姆勒,另一套是科技公司的,最早L4的无人驾驶公司来自于美国,Google吸收了斯坦福的开发团队,之后5年时间内,,在2014年的时候百度、优步等公司开始在无人驾驶上进行研发,之后出现了更多的参与者,到2017年、2016年底的时候滴滴、腾讯等国内公司已经开始进入无人驾驶领域。这是目前中美的无人驾驶运营的状态,美国有Uber,日本有SB Drive,这是我们的合作伙伴。

这是我们发布的一个平台,这个是全国产的传感器,整个传感器会通过我们的平台做数据的预处理,由一根总线输出到无人驾驶的电脑里面,电脑会对整个系统做感知和决策的处理,最终实现无人驾驶控制。

这是目前的两代系统,左边的是第一代系统,以百度为方案,采用高线束的64线,价格非常昂贵,另一个是目前主流的方案,这个方案有一个非常明显的优势,就是一个传感器的冗余性,传感器同时损坏的概率相当低。

之前那套方案有天然的优势,对接固态激光雷达,固态激光雷达由于每个盒子非常狭窄,要实现无人驾驶必须实现多个固态激光雷达的连接,单一的技术并不能连接到激光雷达的这个方案里。

这是Roadstar的两个技术,这个技术包括了Heterosyne技术,是基于之前在百度的经验以及创业的尝试做出来的,这包含了在时间、空间上对LiDAR,对毫米波雷达实现像素级的精度,以及针对这个数据集开发的算法。

这是无人驾驶,除了这两个蓝色的部分,其他的模块我相信90%的公司都会拥有,整体来说包含了传感器模块、感知模块、定位以及决策模块。感知模块包含了红绿灯、物体识别以及行为预测,在定位地图方面也需要定位技术。Roadstar有一个时空的同步,在目前所有的创业公司中,我们是唯一一家采用这套方案的,这套方案可以极大提高感知的精度。

这是一个环视系统,这套系统也是谷歌采用的一套方案,上面的彩色点是激光雷达投影到摄像头中的实时数据,一共有5颗激光雷达投射到里面,这不是单颗激光雷达可以达到的效果,所有的激光点都是像素级的,即使是在高速运动下也能达到。这套系统最好的特征就是可以提高10个点以上的感知精度。我们的感知在业界也是第一,单一传感器能接近90%,融合以后能够达到接近99%的检测精度。

之后跟大家放一段我们全感知的视频,可以看到在整个场景中是没有任何物体丢失。

这里给大家介绍一下无人驾驶的感知技术,目前以百度为代表的公司采用的这个方案,单独的传感器做单独的事,激光雷达进行物体识别,比如人、车的识别,摄像头进行红绿灯识别,毫米波雷达进行停车识别,会做一些算法,这套算法第一次单独做感知没有信息的流失,是最优的方案。

神经网络的架构大概是这样的,可以看到,通过神经网络进行物体识别等。

这是一个像素级别的分割,比如车道线识别,相信很多做ADAS的会强调这块。

这个是我们KITTI,我们是是业界第一,而且在我们之上有两家算法,是非实时的算法,大概在最顶级的电脑上耗时2秒,我们是30毫秒,而且区分度大概在万分之三的精度,我们是唯一一家能实时在车上跑而且达到这样的结果,这只是单一传感器的结果,在内部我们接近了99%的精度。

这是刚才我们强调的感知系统。可以看到这是对物体的识别,在左上角有物体的ID,同一个物体会有同一个ID,右下角是车速,这个车是50公里/小时,旁边的车也是50公里/小时。这套感知系统已经做到了在80米以内的物体识别,整个视频大概有3倍的加速,有了物体的三维空间识别才能做到决策以及完美控制。可以看到这段路的交通场景非常复杂,有特别多的车、人,甚至有逆行的场景。

刚才讲了这么多多传感器的融合。在低维空间里线性不可切,在高维空间是线性可切的。可以看到高维空间的投影是用简单的平面切割的,这和传统的所谓的PCA不太一样,因为PCA对应的是10年、20年、50年计算机的性能以及算法在没有足够好的情况之下用这套方案。这是大家都非常直观的可以看到,右边是能区分开的。

这是我们基于开发的一个定位算法,我相信多数的公司会采用右边这套算法,我们公司采用的是纯三维的地图,可以看到左边的这个地图场景是三维的,树、房屋是三维的数据,包含了基于摄像头的图片数据,右边的数据是平面的数据,平面的数据有一个缺点,首先说没法解决多层停车场的定位,没法解决一些场景的定位。

这是我们定位能力的一个展示,这是一个多层的停车场,通过右上角的摄像头可以看到,这是一个绝对的室内,车辆在里面能够实现厘米级的定位,绿色的是车辆实时感知到的点,蓝色的背景是地图的解读。大家可以看到这是网点拼接的,我们去年就已经在停车场以及隧道等类似的场景中实现。

这是我们的Roadmap,我们公司成立在2017年5月,在9月份就实现了在硅谷的商用,到11月份在硅谷就已经达到了数亿小时的无人工接管,到今天3月份我们实现了在深圳的一个无人驾驶以及在硅谷数天的接管,我们MPI的数据大概是1000公里左右实现无人接管,在国内深圳也能实现数百公里的无人接管。

这是我们的运营计划,首先2018年实现50辆车的小型车队,采集一些数据,完善我们的算法,在2019年,会发力平台系统,比如调度系统,到2022年或者2021年,技术逐渐成熟,成本开始下降,支撑我们批量的在城市里面推广这个车,实现运营。

这个是丰田的一个无人驾驶模块,在2020年的时候丰田想用全固态激光雷达整合车体,这是在今年年初的CES上展出的,跟我们的想法非常相似,我们首先实现目前车辆的无人驾驶,到2025年实现移动空间的概念。右边这个是所有的互联网公司以及科技巨头、车厂的最终目的,控制移动空间、控制用户的接口,好比今天控制安卓手机与苹果手机,谁能控制这套系统谁就有话语权,谁能够实现,谁就能控制下一个比手机更大的设备。

这个是目前无人驾驶经历的几个阶段,最早的阶段是2007年—2015年,所有公司都是这个方案,目前国内多数公司也是采用这个方案。2016年—2019年,是跟我们公司非常像的。2020年—2024年采用的是整合成车身,之后是移动空间,这是我们总结出来的四个阶段,也是得到了丰田及美国一些巨头的承认。

我们2017年完成了天使轮融资,包括云启资本、松禾资本在内等实现了1000万的天使轮融资,我们最近完成的是A轮融资。

最后大家看一下我们的路测情况,这是一个10公里左右的测试路端,刚开始有一个车想调头,我们的车对其进行了识别,并实施了避让。右下角这个显示屏是摄像头实时的数据,这是车辆的实时感知。我们相信是最原始的素材才能真实反映问题,而不是后期经过处理的数据。这段路有45公里/小时的限速,我们的车在路上能进行换道以及一些避让。对于突然插入的情况,可以做到识别并实施刹车。

我今天就讲到这里。

(能见App根据速记整理,未经发言嘉宾审核)

谷歌 / 测试 / 电动汽车 / 无人驾驶 / 传感器 查看更多
资讯

元宇宙凉了?谷歌放弃AR眼镜硬件研发

  随着AI大模型热潮的兴起,越来越多企业和资本将注意力转移到了AI,曾经炙手可热的“元宇宙”风口,现在格外冷清,一些科技巨头甚至开始放弃“元宇宙”了,谷歌就是其中一位。    01 AR眼镜研发一波三折,最终忍痛放弃   6月27日,据Business Insider报道,谷歌中止了AR眼镜项目的研发。结合过去几年谷歌AR项目的大量投入,如今却迎来这个结果,未免让人感到唏嘘不已。   谷歌在20

资讯

库克亲自出席!苹果印度首家Apple Store开业:太阳能电池板供电

苹果在印度的首家Apple Store零售店正式开业,苹果CEO库克出席出席了开业仪式。   据了解,两年前,苹果在印度开设了在线商店。一直以来,苹果都是通过授权经销商和电子商务平台销售其设备。现在Apple BKC将提供门店取货服务,以便客户在线订购产品,它还将举办免费的“Today at Apple”会议。   是全球Apple Store中最节能的零售店之一,配备专用的太阳能电池板,从而实现

资讯

2023年第一季度全球云基础设施服务支出增长19%

  虽然云计算仍然是IT市场中增长最快的部分之一,但面对持续的宏观经济不确定性,客户的投资继续放缓,云增长首次低于20%。   企业正在减少云计算支出,作为整体削减IT预算的一部分,明确强调优化云计算成本,控制云计算浪费,提高云计算部署的效率。头部云厂商都受到了不利影响,增长率比上一季度下降了约为4个百分点。   2023年第一季度前三大云厂商AWS、微软Azure和谷歌云共同增长22%(2022

资讯

ChatGPT到处碰瓷!联网掐谷歌,接入插件成百事通,还想杠上AppStore?

  OpenAI的ChatGPT迭代速度超乎想象,被谷歌聊天 机器人Bard 嘲笑“家里不通网”后,OpenAI一个鲤鱼打挺甩出“实时联网”方案。   美西时间3月23日,OpenAI宣布推出ChatGPT Plugins(插件集),赋予ChatGPT实时更新、使用工具、运行计算的能力。   ChatGPT解除了“断网封印”后便可以释放“洪荒之力”,接入不同的插件就拥有了不同功能的buff,解决生

资讯

绝对的绿色领跑者!亚马逊去年采购了109千兆瓦的清洁能源

近年来,大型科技公司正在主导清洁能源的采购。在众多买家中,亚马逊占据了绝对优势,采购量是第二名的四倍。   根据市场研究公司BNEF发布的数据,2022年亚马逊购买了高达109千兆瓦规模的清洁能源设备,成为全球最大的可再生能源企业买家。这些能源足够厄瓜多尔整个国家使用。   并且,亚马逊的领先优势明显,是第二大清洁能源买家Meta在2022年购买的清洁能源规模的四倍之多。此外,谷歌、微软和智利国家

资讯

高盛:美国公众对银行业危机的恐惧已经“消退”

高盛在一份研报中表示,在硅谷银行和签名银行倒闭之后,随着时间的流逝和监管机构的有效应对,美国公众对银行系统动荡的担忧已逐渐“消退”,存款进一步外流的风险也降低了。 报告指出,自3月中旬以来,人们对地区性银行、以及银行提款和存款安全等关键词的谷歌搜索热度明显下降,这种搜索近日已经回落到“大致正常的水平”。 美国硅谷银行和签名银行在今年3月相继倒闭,震惊了全球市场。虽然这场危机已渐平息,但也有分析师认

资讯

正面挑战微软!谷歌宣布将推出AI写代码功能

  根据谷歌介绍,该功能由全新的“文生代码”模型Codey提供支持,支持超过20种编码语言,包括Go、谷歌标准SQL、Java、JavaScript、Python和Typescript等。   从描述来看,Colab的用户将能够享受实时的代码补全、生成和与编程专用 聊天 机器人的互动,提升开发效率和代码质量。   显然,加入AI生成代码功能的谷歌Colab,与微软的Github Copilot有着

资讯

具身智能成机器人最火热的方向,微软、谷歌、阿里纷纷入局

  黄仁勋表示,人工智能的下一个浪潮将是具身智能(embodied AI),即能理解、推理、并与物理世界互动的智能系统,一台具身智能 机器人将首先可以听懂人类语言,之后分解任务、规划子任务,移动中识别物体,与环境交互,最终完成相应任务。   简单来说,具身智能机器人就是一个足够聪明的AI大脑,再加上足够灵活的躯体,它能通过话语、文字乃至图像等多样方面信息理解我们的指令,并与环境进行交互完成相应的任

资讯

谷歌学苹果做定位生态,安卓生态要撑起定位的另一半天?

  近日,据国外知名爆料者Kuba Wojciechowski透露,谷歌正在开发一项类似于苹果Find My的应用,将有可能随Android 14一齐发布。据了解,在该应用的加持下,设备关机时依然可以进行定位,在Android 14的源码中,该硬件抽象(HAL)名为hardware.google.bluetooth.power_off_finder。   根据代码注释,预先准备的指纹(Finger

资讯

曾经玩花活的公司,如今下海捞钱了!

  波士顿动力公司几十年来,向世界展示了一个炫目的形象—作为一个以 机器人特技秀著称的公司,从能行走雪地的“大狗”到能做困难动作的“阿特拉斯”。但最近,这家公司面临着迄今为止最大的挑战之一:商业化。在刚刚举办的Promat上,波士顿动力发布了其全面商业化的第二款产品Stretch,波士顿动力公司已经很长时间都没有专注于商业化营销,而他们真正开始商业化发展,软银无疑是最大的推动者。   波士顿动力最