295. 来自中央的提问(2 / 2)
鄂维南院士今天没带人来,他最近几年亲自收的徒弟相当之少,关门弟子韩辞还被台上这个人拐跑了,从应用数学不知不觉就转到AI那边去了。
今天来这里,他也是想亲眼看看,孟繁岐能在会程中给大家带来什么样的惊喜。
真要说起来,鄂维南院士应该是在场的高校大佬里唯一一个提前对孟繁岐的技术内容有所涉猎的。
韩辞在辐射场和扩散模型这两个方面的原理推导过程中,也是请教了自己的老师不少的。
“孟先生给我们带来的新技术可以说是非常的震撼,不知道能否请您举一个比较具体的例子,来仔细说明一下神经辐射场技术在自动驾驶中的具体应用。”主持人虽然自己听得云里雾里的,但还是坚持进行了串场。
“没问题,可能我刚才展示的例子还不够方便理解。我们来看这样一个例子,假设一辆自动驾驶车辆在繁忙的城市街道上行驶,遇到一个交叉路口。传统的自动驾驶技术可能会局限于通过传感器获取的有限信息来判断交通状况和障碍物。”
“但是交叉路口的情况常常是复杂和多变的,这样的判断很难保证准确性和安全性吧?”主持人似乎觉得自己既然做出了提问,也应当有所回应。
孟繁岐听到主持人的插话,眉头一扬,好家伙,已经学会捧哏了是吧?
“没错!这正是目前传统办法的一大问题!图像上的内容只要一多一杂乱,就很容易分析不明白。例如在纷繁的十字路口,行人、车辆、建筑、红绿灯、交通指示牌。有太多的东西需要检测分割。”孟繁岐说着,展示了一张交通要道的复杂场景图,其中信息量很大。
他心里也在嘀咕,不知道这主持人是懂还是不懂,这捧哏的气口和内容选择的相当不错。
传统式视觉技术一直存在这样的缺陷,其中一大原因也是因为能够处理的分辨率有限,如果相同的分辨率内塞入了太多的内容,较小的目标就很难被分析清楚。
这是因为目前的深度神经网络会下采样数据,在分辨率仅有原本八分之一乃至十六分之一大小的【特征图】上进行运算,如此一来,小的目标和物体在特征图上可能只能够分到一两个像素点的大小。
在这样的情况下,指望对单张平面图像做到详尽的内容分析,当然是不现实的。
“神经辐射场能够以任意精度来渲染场景。此外,所有的信息都嵌入到神经网络的权重中,所以内存使用量主要取决于网络的大小,而不是场景的复杂度或分辨率。这是一次彻底的改变,从根本上克服了传统3d重建方法的一些主要限制。”
“只要算力足够强大,就能够以夸张的精细程度重建实时的行车场景。相对于非常表面的2d图像分析方式,我想基于神经辐射场的自动驾驶系统,它的准确性和安全性,是不言而喻的。”
一个是在平面上检测不同位置的东西是什么,另一个则是直接在空间中感知什么位置的空间被占据了。
后者的安全性当然要强太多。
此时的自动驾驶技术,几乎全部都停留在如何把相机拍到的东西给识别明白的阶段,有胆子像孟繁岐这样,直接重构三维世界去分析应该如何自动驱使车辆的,那是少之又少。
“孟同学,我看旁边的教授们都还在相互讨论着里面的原理问题,可能一会才会提问。我不是搞技术的,就先问一问我比较关心的问题,跟你刚才所说的内容角度不是特别一样。”
台下第一排,一位相貌稳重庄严,身着白衬衫加西裤的领导人拿起麦克风,提出了一个来自官方视角的问题:“人工智能不仅是一项新技术,同时也是一个新的行业新的产业,我想提问一下,你对就业和岗位方向的问题是如何看待的。”