WiMi 提出基於激光雷達和語義分割的 SLAM 演算法

北京,2023年9月28日 – WiMi全息雲(納斯達克股票代碼:WIMI)是一家領先的全球性全息增強現實(AR)技術提供商,今天宣佈將語義信息和激光雷達技術整合到SLAM算法中,以探索動態環境下基於激光雷達的語義分割SLAM算法。通過執行語義分割,可以顯示環境中潛在的移動物體,這有助於SLAM算法在特徵跟蹤和映射模塊中過濾移動物體,從而獲得更精確的姿態估計結果。語義信息被認為是機器人從感知到認知智能的重要信息。語義SLAM是將語義信息整合到環境表示中的一種重要方法。

基於激光雷達的語義分割SLAM算法首先利用空間注意力網絡對點雲進行語義分割。全卷積神經網絡可以高效地提取和分類點雲數據的特徵,從而實現對環境中不同物體和背景的分割。通過語義分割,我們可以獲得關於移動物體的信息,這有助於在後續的特徵跟蹤和地圖構建過程中過濾移動物體,從而提高姿態估計的精度。此外,為了更好地處理動態環境中的SLAM問題,引入了先驗知識以指導環境元素的分類標準。通過充分利用現有的環境知識,我們可以更準確地確定環境中的哪些元素是靜態的,哪些是動態的。這種先驗知識的引入可以有效提高識別和跟蹤動態元素的準確性。在識別出動態元素後,可以進一步實現姿態估計和語義圖構建。姿態估計是指通過分析傳感器數據推測機器人在環境中的位置和方向。另一方面,語義地圖構建利用已知的環境模型和語義分割結果生成包含語義信息的地圖。這些步驟的完成可以為智能機器人在動態環境中導航和決策提供準確的信息支持。

WiMi提出的基於激光雷達和語義約束的SLAM算法的關鍵技術模塊包括激光雷達數據處理、語義分割、移動靜止物體分離、姿態估計和地圖構建等幾個方面,這些模塊相互協作,共同解決動態環境中的SLAM挑戰,提高環境感知和自我定位的準確性和可靠性。

激光雷達數據處理:激光雷達是獲取環境3D點雲數據的重要傳感器。在SLAM算法中,激光雷達數據經過去噪、過濾和特徵提取等預處理操作。這些操作旨在提取後續姿態估計和地圖構建過程所需的有用特徵信息。

移動靜止物體分離:在動態環境中,需要將動態物體從靜態背景中分離出來。這一步驟通常基於語義分割結果和先驗知識,通過比較點雲數據的運動特性與已知環境模型,區分動態物體和靜態背景。這有效地過濾了動態物體的影響,提高了姿態估計和地圖構建的準確性。

姿態估計:姿態估計用於通過分析傳感器數據推斷機器人在環境中的位置和方向。基於激光雷達的SLAM算法通常使用延伸卡爾曼濾波(EKF)或非線性優化方法進行姿態估計。可以利用語義約束信息約束姿態估計過程以提高其準確性和穩健性。

地圖構建:地圖構建是將在環境中獲取的傳感器數據整合為3D地圖的過程。基於激光雷達的SLAM算法可以通過整合激光雷達數據和語義信息生成包含語義標籤的地圖。這樣的地圖可以提供關於環境結構和特徵的更多信息,為智能機器人的導航和決策提供更豐富的上下文。

隨著AI、5G和物聯網的發展,智能機器人在動態環境中的感知和定位問題已成為熱門的研究領域。WiMi的基於激光雷達的SLAM算法結合了全卷積網絡和語義分割技術,可以有效解決動態環境中的SLAM挑戰,具有準確性、穩健性、場景理解和實時性的技術優勢。它不僅在工業自動化、智能交通和機器人導航等領域具有重要的應用前景,也為未來智能機器人的發展提供了強大支持,使智能機器人能夠在動態環境中實現更高層次的感知、理解和響應能力,為人們的生活帶來更多便利和安全。