10亿图形数据训练自动驾驶算法,特斯拉FSD极速进化

文章正文
发布时间:2024-10-20 15:59

[车友头条-车友号-车轨]  北京时间8月20日,特斯拉在美国成功举办AI Day活动。特斯拉CEO伊隆·马斯克、人工智能部门总监Andrej Karpathy等多位工程师现身会场,公布了特斯拉纯视觉方案FSD的进展、神经网络自动驾驶训练、D1芯片、Dojo超级计算机等重磅信息,带来一场世界前沿的科技盛宴。

坚持视觉感知 用AI神经网络技术提升辅助驾驶能力

特斯拉的纯视觉传感器方案的实现,离不开多任务学习HydraNets神经网络架构。每辆特斯拉汽车拥有8个环绕车身、覆盖周围360°的摄像头,来获取交通信号灯、信号牌、匝道、路缘等周边信息,为神经网络学习提供了绝佳条件。

Andrej说:“我们希望能够打造一个类似动物视觉皮层的神经网络连接,模拟大脑信息输入和输出的过程。就像光线进入到视网膜当中,我们希望通过摄像头来模拟这个过程。”

多任务学习HydraNets神经网络架构可以将8个摄像头获取的画面拼接起来,并完美平衡视频画面的延迟和精准度。通过人工或自动标注车道、车辆、信号灯、障碍物等环境和动静物体,系统会逐帧分析视频画面,了解物体的纵深、速度等信息,再将这些数据交给车队学习。

但是在这个过程中,特斯拉发现了几个问题:这些参数和空间追踪是很难通过C++这个基础架构实现拼接的;有一些空间数据的输出质量不高;不同摄像头获取的物体信息不同,拼合时很难进行整体把握。

为解决这些问题,特斯拉开发了“矢量空间”(Vector Space)技术,同时兼具了非凸优化算法(Non-convex)、高维度两大优势。该技术可以通过8个摄像头输入的数据为基础绘制3D鸟瞰视图,形成4D的空间和时间标签的“路网”以呈现道路等信息,帮助车辆把握驾驶环境,更精准的寻找最优驾驶路径。