ゼファーネットのロゴ

人工知能を使用してデジタルマップを充実させる

日付:

衛星画像を使用してデジタルマップの道路の特徴にタグを付ける、MITとカタールコンピューティング研究所(QCRI)の研究者が発明したモデルは、GPSナビゲーションの改善に役立ちます。  

ドライバーにルートに関する詳細を表示すると、見慣れない場所をナビゲートするのに役立つことがよくあります。 たとえば、レーンカウントにより、GPSシステムは、分岐または合流するレーンについてドライバーに警告することができます。 駐車スポットに関する情報を組み込むと、ドライバーが事前に計画を立てるのに役立ち、自転車レーンをマッピングすることで、サイクリストが忙しい街の通りを交渉するのに役立ちます。 道路状況に関する最新情報を提供することで、災害救援の計画を改善することもできます。

しかし、詳細な地図の作成は、主にグーグルなどの大企業が行う費用と時間がかかるプロセスであり、s フードにストラップが取り付けられたカメラで周辺の道路のビデオや画像を撮影する車両。 それを他のデータと組み合わせると、正確で最新のマップを作成できます。 ただし、このプロセスにはコストがかかるため、無視されている地域もあります。

解決策は、衛星画像上で機械学習モデルを解き放ち、かなり簡単に入手してかなり定期的に更新することです。これにより、道路の特徴に自動的にタグを付けることができます。 しかし、道路は、たとえば木や建物によって塞がれる可能性があるため、困難な作業になります。 で MITとQC​​RIの研究者は、人工知能振興会議で発表された「RoadTagger」について説明します。RoadTaggerは、ニューラルネットワークアーキテクチャの組み合わせを使用して、障害物の背後にある車線と道路タイプ(住宅または高速道路)の数を自動的に予測します。

米国の20の都市のデジタルマップからの隠された道路でRoadTaggerをテストする際、モデルは77%の精度で車線数を数え、93%の精度で推定道路タイプを数えました。 研究者らはまた、RoadTaggerが駐車スポットや自転車レーンなどの他の機能を予測できるようにすることも計画しています。

「最新のデジタルマップは、大企業が最も気にかけている場所からのものです。 彼らがあまり気にしない場所にいると、マップの品質に関して不利になります」と、電気工学およびコンピュータサイエンス学科(EECS)の教授である共著者のSam Maddenは言います。コンピュータサイエンスおよび人工知能研究所(CSAIL)の研究者。 「私たちの目標は、高品質のデジタルマップを生成するプロセスを自動化して、どの国でも利用できるようにすることです。」

この論文の共著者は、CSAILの大学院生であるSongtao He、Favyen Bastani、およびEdward Parkです。 EECS学部生Satvat Jagwani; CSAILの教授Mohammad AlizadehとHari Balakrishnan; QCRIの研究者であるSanjay Chawla、Sofiane Abbar、Mohammad Amin Sadeghi。

CNNとGNNの組み合わせ

マッデン氏は、QCRIの本拠地であるカタールは、「デジタルマップを構築する大企業にとっては優先事項ではありません」と語っています。 それでも、特に2022 FIFAワールドカップの開催に向けて、常に新しい道路を建設し、古い道路を改善しています。

「カタールを訪問している間、私たちはUberドライバーが彼がどこに行くのかを見つけることができないという経験をしました。マップがとても離れているからです」とMaddenは言います。 「車線の合流など、ナビゲーションアプリに適切な情報がない場合、これはイライラするか、悪化する可能性があります。」

RoadTaggerは、画像処理タスクに一般的に使用される畳み込みニューラルネットワーク(CNN)とグラフニューラルネットワーク(GNN)の新しい組み合わせに依存しています。 GNNはグラフ内の接続されたノード間の関係をモデル化し、ソーシャルネットワークや分子動力学などの分析に人気を博しています。 モデルは「エンドツーエンド」です。つまり、生のデータのみが供給され、人間の介入なしに自動的に出力が生成されます。

CNNは、ターゲット道路の未加工の衛星画像を入力として受け取ります。 GNNは道路を約20メートルのセグメント、つまり「タイル」に分割します。 各タイルは、道路に沿った線で接続された個別のグラフノードです。 CNNはノードごとに道路の特徴を抽出し、その情報を隣接するノードと共有します。 道路情報はグラフ全体に沿って伝播し、各ノードは他のすべてのノードの道路属性に関する情報を受け取ります。 特定のタイルが画像に隠れている場合、RoadTaggerは道路に沿ったすべてのタイルの情報を使用して、オクルージョンの背後にあるものを予測します。

この組み合わされたアーキテクチャは、より人間に近い直感を表すと研究者たちは述べています。 たとえば、XNUMX車線の道路の一部が木に隠れているため、一部のタイルにはXNUMX車線しか表示されていません。 人間は、いくつかの車線が木の後ろに隠れていると簡単に推測できます。 従来の機械学習モデル(たとえば、CNNのみ)は、個々のタイルの特徴のみを抽出し、オクルードされたタイルがXNUMX車線の道路であると予測します。

「人間は隣接するタイルからの情報を使用して、隠れたタイルのレーン数を推測できますが、ネットワークはそれを行うことができません」と彼は言います。 「私たちのアプローチは、CNNからのローカル情報とGNNからのグローバル情報をキャプチャしてより適切な予測を行う、人間の自然な行動を模倣することを試みています。」

学習の重み   

RoadTaggerをトレーニングおよびテストするために、研究者たちはOpenStreetMapと呼ばれる実際の地図データセットを使用しました。これにより、ユーザーは世界中のデジタル地図を編集およびキュレートできます。 そのデータセットから、ボストン、シカゴ、ワシントン、シアトルを含む688の米国の都市の20平方キロメートルの地図から確認済みの道路属性を収集しました。 次に、Googleマップのデータセットから対応する衛星画像を収集しました。

トレーニングでは、RoadTaggerは、CNNとGNNの重み(機能とノード接続にさまざまな重要度を割り当てる)を学習します。 CNNはタイルのピクセルパターンから特徴を抽出し、GNNは学習した特徴をグラフに沿って伝播します。 道路のランダムに選択されたサブグラフから、システムは各タイルで道路の特徴を予測することを学習します。 そうすることで、どの画像の特徴が有用であり、それらの特徴をグラフに沿って伝播する方法を自動的に学習します。 たとえば、ターゲットタイルに不明確な車線マーキングがあり、その隣接タイルに明確な車線マーキングがあるXNUMXつの車線があり、同じ道路幅を共有している場合、ターゲットタイルにもXNUMXつの車線がある可能性があります。 この場合、モデルは道路幅が有用な画像機能であることを自動的に学習するため、XNUMXつの隣接するタイルが同じ道路幅を共有している場合、それらは同じ車線数を持つ可能性があります。

OpenStreetMapからのトレーニングでは見られない道路がある場合、モデルは道路をタイルに分割し、学習した重みを使用して予測を行います。 モデルは、隠れたタイルのレーン数を予測するタスクを課され、隣接するタイルが一致するピクセルパターンを持っているため、情報を共有する可能性が高いことに注意します。 したがって、これらのタイルにXNUMXつのレーンがある場合、オクルードされたタイルにもXNUMXつのレーンが必要です。

別の結果として、RoadTaggerは、合成された、非常に困難な道路の混乱のデータセットでレーン数を正確に予測しました。 XNUMXつの例として、XNUMX車線の高架がXNUMX車線の対象道路のいくつかのタイルを覆っています。 モデルは高架のピクセルパターンの不一致を検出したため、覆われたタイル上のXNUMXつのレーンを無視し、XNUMXつのレーンが下にあると正確に予測しました。

研究者は、RoadTagger を使用して、多くの地図に車線数やその他の詳細が含まれていない OpenStreetMap などのデータセットのインフラストラクチャに対する継続的な変更を人間が迅速に検証および承認できるようにしたいと考えています。 バスターニ氏によると、特に関心のある地域はタイで、道路は常に変化していますが、最新情報はほとんどありません。
データセット。

「かつて未舗装の道路としてラベル付けされていた道路は舗装されているため、運転するのが適切であり、一部の交差点は完全に建設されています。 毎年変化はありますが、デジタルマップは時代遅れです」と彼は言います。 「私たちは、最新の画像に基づいて、そのような道路属性を常に更新したいと考えています。」


トピック: 研究, コンピューター科学と技術, アルゴリズム, 輸送手段, 都市, 自動車, 機械学習, コンピュータサイエンスと人工知能研究所(CSAIL), 電気工学およびコンピュータサイエンス(eecs), 工学系研究科, 人工知能

出典:http://news.mit.edu/2020/artificial-intelligence-digital-maps-0123

スポット画像

最新のインテリジェンス

スポット画像