行動予測は自動運転車で重要な役割を果たします
21333
post-template-default,single,single-post,postid-21333,single-format-standard,bridge-core-1.0.4,translatepress-ja,bridge,ajax_fade,page_not_loaded,,qode_grid_1200,qode-content-sidebar-responsive,wpb-js-composer js-comp-ver-5.7,vc_responsive
 

自動運転車での行動予測の使用

自動運転車での行動予測の使用

1211月20

自動運転車での行動予測の使用

Over the next decade autonomous vehicles (AV) are expected to reduce the number of road accidents and to improve overall road safety. Behavioral prediction plays a key role in efficient decision making and enables risk assessment in AV applications. For example, while driving on a two-lane road you are intending to go left and another car in the second lane is coming from the opposite direction. How will that vehicle behave? Will it continue straight? Will it make a turn? Prediction in autonomous vehicles means predicting the trajectory or path of the other vehicle and deciding on an appropriate action to avoid collision.

既存の課題

道路の形状と交通ルールは、車両の動作を完全に変える可能性があります。たとえば、4方向の「一時停止」標識に近づく車両の動作は即座に変化する可能性があります。交通ルールや道路の形状を考慮せずに静的な運転環境でトレーニングされたモデルは、他の運転環境では限られた価値しか証明されません。車両の挙動を正確に予測するには、マルチモーダルアプローチが必要です。マルチモーダルとは、車両の動きの履歴を考慮して、複数の可能な将来のアクションが存在することを意味します。たとえば、車両が方向指示器のない「一時停止」標識に近づいている場合、直進するか、方向転換することができます。

AV予測モデルの構築

その環境と周囲のオブジェクトのダイナミクスと将来の動作を理解するために、AVモデルはデータ入力を必要とします。 AV予測の一般的な入力は、センサーの融合とローカリゼーションから得られます。センサーフュージョンデータは、カルマンフィルターを使用して、複数のセンサー(レーダー、LIDARなど)からの入力を結合することによって生成されます。

鳥瞰図(BEV)ラスタライズは、AVデータを操作する際のシステムの入力として一般的な選択肢です。 BEVは、シーンのトップダウンビューで構成されます。 BEVを使用してモデルを構築すると、入力と出力の座標空間が同じになるため、予測プロセスが簡素化されます。インフラストラクチャセンサーは、遮蔽されていない環境のトップダウンビューを提供できます。

自動運転システムはマルチエージェント環境です。深く教師あり学習アプローチは、道路上のまれで予期しない行動を正確にキャプチャすることにより、マルチエージェント環境に対処できます。 AVスタック内では、自動運転システムの構築に関連する3つのタスクを次のように定義できます。

  • 知覚(AVの周りのオブジェクトを識別する)
  • 予測(適切な次のステップの決定)
  • 計画(将来のAV動作の決定)

 

予測に焦点を当てると、将来の潜在的な行動に関連する重要なデータをAVに提供するモデルを構築できます。研究によると、ディープラーニングベースのモデルの中で、複数のRNNやResnet、RNNとCNNの組み合わせなどの複雑なモデルは、単一のRNNのような単純なモデルよりも優れたパフォーマンスを実現します。

ユニモーダル軌道の代わりにマルチモーダル軌道を予測すると、必ずしもRMSEが低くなるとは限りませんが、パフォーマンスは向上します。たとえば、GRIPおよびST-LSTMはマルチモーダル軌道を処理するため、GRIPおよびST-LSTMという名前のモデルはM-LSTMおよびCS-LSTMと比較して優れたパフォーマンスを達成しました。より高いRMSEは、マルチモーダル軌道予測モデルのトレーニングで使用されるモデル容量および/またはデータの制限の結果である可能性があります。

AV予測モデルの改善:

AV予測モデルの全体的なパフォーマンスを向上させるために使用できるメカニズムがいくつかあります。それらには以下が含まれます:

  • トレーニング速度:ディープネットワークの最初と最後のレイヤーの次元を増やすと、速度が向上し、ResNetの代わりに軽量のEfficientNetを使用すると、モデルのパフォーマンスが向上します。
  • パフォーマンス: エージェント履歴を予測モデルに追加すると、予測の精度と信頼性を向上させることができます。
  • 不確実性の捕捉: マルチモーダル予測は、エージェントごとに1つの軌道では、さまざまな状況の不確実性をキャプチャして分析するのに十分でない場合に適しています。

 

評価指標

AV予測の評価指標は、予測される要因の数によって異なります。車両の行動予測に関係する一般的な要因には、精度、適合率、再現率、F1スコア、および負の可能性が含まれます。軌道予測評価メトリックには、FDE(最終変位誤差)、MAE(平均絶対誤差)、RMSE(二乗平均平方根誤差)、最小Kメトリック、およびクロスエントロピーが含まれます。

結論

ディープラーニングソリューションは、複雑な運転シナリオでの軌道と行動の予測に有望なパフォーマンスを示しています。ほとんどの既存のソリューションは、車両間の相互作用のみを考慮しています。これらのソリューションは、潜在的な動作の非常に狭い評価を提供します。交通ルール、道路形状、環境条件、およびその他の変数を組み込んだモデルは、はるかに深く幅広い予測分析を生成します。

車両の挙動予測は複雑なプロセスです。を利用することによってのみ満たすことができる多くの課題がまだあります 次世代技術 およびアプリケーション。