万字分析汽车毫米波雷达点云技术( 四 )


A.     最佳性能架构我们首先展示了使用我们性能最好的架构获得的结果 。我们仅使用来自车辆A 的数据进行五重交叉验证 。除了两个空间坐标x和y(在车辆坐标系中), 我们还用自我运动补偿的多普勒速度和RCS值来丰富输入点云 。因此 , 我们提供了一个四维的点云作为输入 。
 
由此产生的混淆矩阵如图5所示 。
 

万字分析汽车毫米波雷达点云技术

文章插图
 
图5 用图4中描述的网络结构进行5重交叉验证后的相对混淆矩阵 。点云的输入特征:x, y, vˆr , σ 。
 
不足为奇的是 , 带有静态标签的多数类显示出最高的真阳值 。然而 , 我们应该知道 , 区分属于移动或非移动物体的反射 , 远比在多普勒速度上设置一个阈值 , 并将速度低于该阈值的每个反射归类为静态反射要难得多 。在现实场景中 , 许多不属于运动物体的反射显示出非零的自我运动补偿的多普勒速度 , 这是由里程表误差、传感器偏差、时间同步误差、镜像效应或其他传感器伪影引起的 。此外 , 多普勒速度为零的反射不一定属于静态物体 , 因为旋转的汽车车轮底部或行人的身体部位(沿行走方向垂直移动)也可能不显示径向速度 。
 
汽车类的物体被分类为次优 , 再次是行人组 。卡车类的对象经常与汽车混淆 。有两个原因可以解释这种混淆:第一 , 在很远的距离上 , 每个物体只能测量到很少的反射 , 因此很难推断物体的空间范围 。其次 , 汽车和卡车实例之间的转换相当顺利的 , 因为 , 例如 , 大型SUV与小型卡车很难区分 。
 
从图中可以推断出的另一个显著行为是行人和行人组之间的高度混淆 。这种行为可能是由我们的训练数据引起的 , 因为对于人类注释员来说 , 有时可以将附近两个行人的反射指定给个人 , 从而创建两个行人的实例 , 但有时这不容易 , 而且时间要求也太高 。使所有反射都标记为行人组的单个实例 。因此 , 除了复杂的任务本身之外 , 网络还必须与地面真实数据的不一致性作斗争 。对于许多驾驶任务来说 , 了解某一区域是否有一个或两个行人并不重要 , 这样两个等级就可以合并在一起 , 从而产生超过91%的真实阳性率 。
 
由于数据集高度不平衡 , 只检查归一化为类计数的相对混淆矩阵可能会产生误导 。因此 , 我们也在图6中展示了具有绝对值的混淆矩阵 。这种可视化强调了许多假阳性动态对象是由网络创建的(图中的最后一行) 。这种效果对于汽车类来说是最明显的:只有68%的预测汽车反射属于动态物体(参见图6的第一列) 。然而 , 对于汽车应用来说 , 动态物体的高假阳性率可能比高假阴性率更可取 。降低静态类的损失函数中的权重会导致更高的假阳性值 , 所以这个参数允许我们在假阳性和假阴性之间进行调整 。
 
万字分析汽车毫米波雷达点云技术

文章插图
 
图6 用图4中描述的网络结构进行5重交叉验证后的绝对混淆矩阵 。点 云的输入特征:x, y, vˆr , σ 。
 
应该注意的是 , 动态反射和静态反射之间的混淆百分比(图5中混淆矩阵的最后一列)并不代表被忽略的对象的百分比 。如果动态物体只有一个反射被正确分类 , 但同一物体的其他反射被分类为静态的 , 即使假阴性计数增加 , 该物体仍然被检测到 。
B.     输入特征的变化为了更深入地了解哪些信息对网络有用 , 我们用三组不同的输入特征 f1 = x, y, vˆr  , f2 =  x, y, σ  , f3= x, y重复五重交叉验证 , 并将结果与原始特征 f0  =  x, y, vˆr, σ进行比较 。在表II中 , 显示了每个输入配置的F1分数 。从这个表中可以看出以下几点 。呈现给网络的输入特征越多 , 性能就越高 。在输入特征中加入每个反射的RCS值会使F1分数小幅增加(从0.7303到0.7425) , 而加入自我运动补偿的多普勒速度则影响更大 , 使得分数几乎增加了0.1 。尽管多普勒速度作为一个特征 , 有一定的重要性 , 但有趣的是 , 对于输入特征f2和f3 , 网络的性能仍然远远高于随机猜测 。这意味着反射的空间环境对网络来说是非常有表现力的特征 , 并为分类步骤奠定了基础 , 然后再利用速度和RCS值的附加特征进行分类 。


推荐阅读