摘要:該文設(shè)計了一種基于深度學(xué)習(xí)框架的一站式國產(chǎn)多源衛(wèi)片圖斑自動提取平臺。平臺主要聚焦地物目標語義分割、圖斑提取智能算法群和深度特征解譯 3 個關(guān)鍵技術(shù),針對遙感影像解譯中色差較大、單張圖像數(shù)據(jù)量巨大、多通道影像信息多元表達、不同遙感目標大小差距過大等問題,將智能語義分割和圖斑自動提取算法群納入系統(tǒng)框架內(nèi),構(gòu)建了多種按需定制的通用模型及專題模型,同時開放模型自訓(xùn)練。平臺集成海量數(shù)據(jù)管理、數(shù)據(jù)標注、模型訓(xùn)練、模型測試、圖斑提取、應(yīng)用分析等功能,實現(xiàn)了山西太原城區(qū)多源國產(chǎn)衛(wèi)片建筑、植被、農(nóng)田、工業(yè)區(qū)、水體等地物目標智能語義分割和圖斑提取。
">時間:
0 引言
隨著《國家民用空間基礎(chǔ)設(shè)施中長期發(fā)展規(guī)劃(2015—2025 年)》和中國高分辨率對地觀測系統(tǒng)等重大戰(zhàn)略性工程的實施,國產(chǎn)高分辨率遙感數(shù)據(jù)日益豐富。如何從海量多源遙感圖像中自動地、準確地解譯出地物信息是當(dāng)前遙感研究迫切需要解決的問題。傳統(tǒng)的提取方法效率低,無法滿足處理大量遙感影像的需求。因此,在大數(shù)據(jù)和人工智能的背景下,迫切需要運用機器視覺、深度學(xué)習(xí)等先進理論對圖斑的特征、規(guī)律及屬性進行系統(tǒng)性研究,實現(xiàn)圖斑的智能化和自動化提取。
本文在全局圖推理地物目標智能語義分割模型構(gòu)建、深度學(xué)習(xí)全天候衛(wèi)片圖斑提取智能算法群構(gòu)建、多尺度深度特征多維感知解譯技術(shù)研究關(guān)鍵技術(shù)基礎(chǔ)上,通過研究可擴展的高效分布式時空數(shù)據(jù)存儲與管理技術(shù),設(shè)計了基于地理國情普查數(shù)據(jù)的海量樣本制作方法體系,研建了具有衛(wèi)片管理、數(shù)據(jù)處理、模型訓(xùn)練、圖斑提取、應(yīng)用分析等功能模塊的國產(chǎn)多源衛(wèi)片圖斑提取平臺。實現(xiàn)了對海量多源衛(wèi)星遙感數(shù)據(jù)合理規(guī)范的組織、高效精確的管理以及海量遙感影像的快速、準確處理,并提供了精準便捷的服務(wù),極大地發(fā)揮了衛(wèi)星遙感數(shù)據(jù)的價值。
1 國產(chǎn)多源衛(wèi)片圖斑智能提取平臺總體架構(gòu)設(shè)計
平臺依據(jù)實用性、可靠性、先進性、可擴展性等原則進行設(shè)計,總體框架按照數(shù)據(jù)層、業(yè)務(wù)層和應(yīng)用層 3 部分進行設(shè)計。
數(shù)據(jù)層是平臺的基礎(chǔ),主要負責(zé)數(shù)據(jù)的存儲、管理和處理。該層通過研究可擴展的高效分布式時空數(shù)據(jù)存儲與管理技術(shù),設(shè)計了基于地理國情普查數(shù)據(jù)的海量樣本制作方法體系,并針對山西省太原城區(qū)高分系列、北京二號、高景一號、吉林一號等多種國產(chǎn)衛(wèi)星系列衛(wèi)片特性,通過對原始影像數(shù)據(jù)進行幾何校正、圖像增強、降噪及合成,實現(xiàn)了數(shù)據(jù)優(yōu)化和處理,以適應(yīng)后續(xù)圖斑解譯及分析任務(wù),實現(xiàn)了多源遙感影像數(shù)據(jù)的集成管理。
業(yè)務(wù)層是平臺的核心,主要負責(zé)圖斑智能提取。該層根據(jù)應(yīng)用層的需求,從數(shù)據(jù)層獲取相關(guān)數(shù)據(jù),并運用圖斑提取智能算法群和模型進行智能提取和分析。通過對遙感解譯樣本庫進行深度學(xué)習(xí),利用智能語義分割和基于深度學(xué)習(xí)的多時相、長時序、全天候、多源海量衛(wèi)片圖斑提取智能算法群,內(nèi)置了多個通用模型及專題模型,實現(xiàn)了耕地、林地、草地、水體、建筑物、硬化地表、堆掘地 7 類地物全地類實時、智能圖斑提取和變化監(jiān)測。主要包括多源多時相衛(wèi)片數(shù)據(jù)影像管理、影像處理、樣本標注與管理、全地類圖斑智能化提取、統(tǒng)計分析、變化監(jiān)測等功能。
應(yīng)用層是平臺與用戶交互的接口,主要負責(zé)提供用戶友好的界面和交互方式。該層將業(yè)務(wù)層的功能進行封裝和展示,使用戶能夠方便地使用智能提取平臺的各種功能。平臺充分利用 PB 級多源衛(wèi)星數(shù)據(jù),基于智能化圖斑提取平臺,結(jié)合行業(yè)用戶實際應(yīng)用需求,設(shè)計了能源安全動態(tài)監(jiān)測、耕地保護動態(tài)監(jiān)測、林草覆蓋動態(tài)監(jiān)測、城區(qū)水體變化動態(tài)監(jiān)測、城市規(guī)劃建設(shè)動態(tài)監(jiān)測等方面示范應(yīng)用,可以為政治、經(jīng)濟、文化、生態(tài)、能源等各領(lǐng)域的行業(yè)用戶提供遙感應(yīng)用解決方案以及業(yè)務(wù)相關(guān)的遙感影像專題產(chǎn)品和服務(wù)。
該多源衛(wèi)片圖斑智能提取平臺具有多模特征融合、軟件系統(tǒng)自主可控、算法普適性強、可靈活部署、一體化訓(xùn)練和解譯等特征優(yōu)勢,擁有完全自主知識產(chǎn)權(quán)。
2 平臺功能設(shè)計
平臺功能包括影像數(shù)據(jù)管理、影像數(shù)據(jù)預(yù)處理、解譯樣本管理、圖斑提取和統(tǒng)計分析等 5 個模塊。
2.1 影像數(shù)據(jù)管理
影像管理提供了對多時相、長時序、全天候、多源海量衛(wèi)星影像數(shù)據(jù)進行有效管理和組織的能力。通過建立多源異構(gòu)影像數(shù)據(jù)庫,并提供相應(yīng)的管理工具和功能,實現(xiàn)快速、高效地獲取、瀏覽、查詢和使用衛(wèi)星影像數(shù)據(jù)。
2.2 影像數(shù)據(jù)預(yù)處理
影像數(shù)據(jù)預(yù)處理模塊主要是對原始影像數(shù)據(jù)進行處理和優(yōu)化,以提供更好的數(shù)據(jù)質(zhì)量和適應(yīng)后續(xù)圖斑解譯以及分析任務(wù)的需求。通過一系列預(yù)定義的操作,對影像數(shù)據(jù)進行校正、增強、降噪及合成等操作,從而提高圖像辨識度,為后續(xù)處理提供基礎(chǔ)。
2.3 解譯樣本管理
解譯樣本管理模塊采用 MongoDB 數(shù)據(jù)庫對解譯樣本進行有效管理和組織,為圖斑提取智能模型提供訓(xùn)練及驗證所需的樣本支持。
2.4 圖斑提取
圖斑提取模塊是國產(chǎn)遙感影像衛(wèi)片圖斑提取平臺的核心,借助智能語義分割及圖斑提取智能算法群等關(guān)鍵技術(shù),能夠從遙感影像中自動提取出具有獨立空間特征的圖斑,并對其進行組織分類、空間定位、矢量化、指標驗證和成果輸出等操作。系統(tǒng)包含 10 種提取模型,通過選擇提取模型,自動從遙感影像中提取出具有獨立空間特征的圖斑。采用智能提取及深度學(xué)習(xí)技術(shù),能夠準確識別不同地物類型的圖斑,并以不同 RGB 值進行標注。圖斑提取包括地物分類、指定地類提取和通用變化檢測。
2.5 統(tǒng)計分析
統(tǒng)計分析模塊提供了強大的數(shù)據(jù)統(tǒng)計分析能力,能夠?qū)崿F(xiàn)對衛(wèi)星圖斑提取結(jié)果進行深入的統(tǒng)計分析,探索地物目標的分布規(guī)律、變化趨勢和相互關(guān)系。同時,提供了直觀的數(shù)據(jù)可視化工具,以圖表、圖像等形式展示統(tǒng)計結(jié)果,使用戶能夠更好地理解和解讀數(shù)據(jù)。
3 基于地理國情數(shù)據(jù)的遙感影像解譯樣本庫構(gòu)建
為完成國產(chǎn)遙感影像衛(wèi)片圖斑提取平臺研建,并為圖斑智能提取工作提供遙感影像數(shù)據(jù)及圖斑提取樣本庫,在國產(chǎn)多源衛(wèi)片圖斑提取平臺系統(tǒng)設(shè)計的基礎(chǔ)上,研究了可擴展的高效分布式時空數(shù)據(jù)存儲與管理技術(shù),實現(xiàn)了 PB 級多源衛(wèi)星遙感數(shù)據(jù)的匯聚。此外,設(shè)計了一套基于地理國情普查數(shù)據(jù)的海量樣本制作方法體系,為平臺的衛(wèi)片管理、樣本制作等子系統(tǒng)提供了技術(shù)支撐。
樣本庫數(shù)據(jù)集采用山西省太原城區(qū)高分系列、北京二號、高景一號、吉林一號等多種國產(chǎn)衛(wèi)星系列衛(wèi)片。根據(jù)實際需要,將城區(qū)范圍地物分為耕地、林地、草地、水體、建筑物、硬化地表、堆掘地、其他等 8 個大類。充分利用已有地理國情資料,在地理國情監(jiān)測分類的基礎(chǔ)上,結(jié)合對應(yīng)的遙感影像資料,制作項目所需標識,形成樣本,按照一定的數(shù)據(jù)組織,構(gòu)建遙感解譯樣本庫。
采用 2015—2021 年的地理國情監(jiān)測數(shù)據(jù),共 7 期,每個時期以基礎(chǔ)地理信息現(xiàn)有分類體系為基礎(chǔ),參考相關(guān)專業(yè)部門開展的監(jiān)測內(nèi)容分類,包含一級類、二級類及三級類。分幅影像數(shù)據(jù)按照對應(yīng)的區(qū)域進行鑲嵌,鑲嵌時保證地物的完整和色調(diào)的一致;在鑲嵌影像數(shù)據(jù)的基礎(chǔ)上,按照研究區(qū)域,對影像進行裁切。影像命名采用行政區(qū)劃代碼加年份進行命名。圖斑(標識)樣例數(shù)據(jù):地理國情監(jiān)測圖斑數(shù)據(jù)包含一級類、二級類及三級類,通過圖斑的歸并和整合,對應(yīng)整合為耕地、林地、草地、水體、建筑物、硬化地表、堆掘地等分類,對于監(jiān)測分類圖斑未能與研究項目對應(yīng)的分類,統(tǒng)一歸為其他類,通過拆分、合并等工作,生成標注信息文件。
太原城區(qū)衛(wèi)星圖像數(shù)據(jù)集包含太原市 6 個城區(qū)總面積 1417.0 km² 的 1 m 級衛(wèi)星圖像,圖像總像幅達到 56251 像素 ×52654 像素。整體容量大小為 12.7 GB。將 2019 年太原遙感影像原圖和標簽進行了滑動窗口裁剪,裁剪尺寸為 512×512,得到裁剪后的小圖 11330 對,將其中全部為黑色的無效圖片刪除后得到 6607 對遙感影像小圖和與之對應(yīng)的標簽圖。
4 關(guān)鍵技術(shù)研究及試驗
山西省太原城區(qū)地域特征明顯,包括山地、平地、丘陵、農(nóng)村、城市和城鄉(xiāng)結(jié)合帶等不同地域,城市發(fā)展空間集聚,是我國重要的能源、化工基地。針對太原城區(qū)特有的圖斑復(fù)雜、破碎率高、變化頻繁等特點,本國產(chǎn)多源衛(wèi)片圖斑智能提取平臺采用深度學(xué)習(xí)的遙感圖像智能解譯方法,將智能語義分割與圖斑提取算法群等模型納入統(tǒng)一的框架中,實現(xiàn)完全自主知識產(chǎn)權(quán)的多源海量國產(chǎn)遙感影像智能語義分割和圖斑提取。
平臺采用自注意力機制、圖推理、自適應(yīng)學(xué)習(xí)、多尺度特征提取和深度特征解譯等研究方法,這些研究方法都是視覺領(lǐng)域目前最先進的理論。其中,自注意力機制能夠有效地根據(jù)信息的重要程度進行差異化學(xué)習(xí),提高全局信息的交互利用,而圖推理方法適用于處理以圖形方式表示的數(shù)據(jù),因此,全局圖推理方法更有利于捕獲圖像信息。自適應(yīng)方法能夠根據(jù)處理數(shù)據(jù)的特征自動調(diào)整處理方法,有效削弱傳感器類型、季節(jié)變化、太陽高度、大氣條件、椒鹽噪聲、輪廓定位粗糙等因素影響,與所處理數(shù)據(jù)的統(tǒng)計分布和結(jié)構(gòu)特征相適應(yīng),取得最佳的處理效果。多尺度特征多維感知的深度特征解譯技術(shù)能夠聯(lián)合空譜互補信息進行協(xié)同利用,有效避免 “同物異譜”“異物同譜” 現(xiàn)象造成的圖斑提取準確率下降。
平臺系統(tǒng)結(jié)構(gòu)模型內(nèi)置多個通用模型及專題模型,根據(jù)需求選取不同的訓(xùn)練數(shù)據(jù)集進行訓(xùn)練。模型訓(xùn)練成功后,選取與待處理的遙感影像具有相同分布的數(shù)據(jù)集進行語義分割與圖斑提取,檢驗其準確率及平均交并比等參數(shù),符合技術(shù)指標后應(yīng)用模型。解譯模型時根據(jù)選定的智能語義分割及圖斑自動提取算法提取解譯模型,獲取需要解譯的圖像,解譯完成后對結(jié)果進行存儲。平臺設(shè)計綜合考慮具有多模特征融合、軟件系統(tǒng)自主可控、算法普適性強、可靈活部署、一體化訓(xùn)練和解譯等特征優(yōu)勢,并面向自然資源、生態(tài)環(huán)保、農(nóng)林生產(chǎn)等行業(yè)開展應(yīng)用示范,從而提供一站式人工智能解譯與推理預(yù)測服務(wù)。
平臺構(gòu)建基于深度學(xué)習(xí)的多時相、長時序、全天候、多源海量衛(wèi)片圖斑提取智能算法,通過人工智能技術(shù)解決圖斑提取時空語義鴻溝問題,有效降低噪聲影響,研建衛(wèi)片圖斑提取平臺,提升圖斑提取準確率。
4.1 全局圖推理地物目標智能語義分割模型構(gòu)建
針對圖斑提取時空語義鴻溝問題,首先基于注意力的捕獲全局上下文信息,同時聯(lián)合結(jié)構(gòu)化的邊緣、紋理、光譜等信息,進行遙感影像特征增強;其次,定義適合語義分割任務(wù)的圖抽象,構(gòu)建節(jié)點與結(jié)構(gòu)、邊緣與圖關(guān)系之間的關(guān)系交互;最后,結(jié)合注意力機制與圖推理,構(gòu)建遙感影像語義分割模型。
4.2 深度學(xué)習(xí)全天候衛(wèi)片圖斑提取智能算法群構(gòu)建
針對多時相、長時序、全天候、多源海量衛(wèi)片,基于深度學(xué)習(xí)技術(shù)構(gòu)建智能算法群。設(shè)計自適應(yīng) Transformer 融合模塊和低級語義信息保留編碼優(yōu)化圖像解析精度;構(gòu)建 DEPAG 特征解耦模塊刻畫不同因素影響下樣本的視覺特征;提出上下文細節(jié)融合模塊和耦合注意力融合模塊進行全局和局部建模融合;對多圖斑提取模型進行優(yōu)化并納入系統(tǒng)框架內(nèi),設(shè)計模型自適應(yīng)選取規(guī)則,建立動態(tài)模型推理方式,形成基于深度學(xué)習(xí)技術(shù)的多元海量衛(wèi)片圖斑提取智能算法群。本次試驗構(gòu)建的算法群包括有 Unetformer,CCTNET,EMRT,DeepLabV3 +,RSSFormer,DDSSN,ResNetDL 及 Res2NetDL 等算法群。
4.3 多尺度深度特征多維感知解譯技術(shù)研究
由于遙感影像變化檢測中的 “同物異譜”“異物同譜” 現(xiàn)象,難以依靠單一維度特征和單尺度特征進行特征解譯,因此,本文針對該現(xiàn)象對空間與光譜等多個維度上的特征進行多尺度特征提取,實現(xiàn)深度特征解譯,進行圖譜協(xié)同的異源遙感圖像變化檢測。通過對地物目標進行光譜、空間、時間等多個維度上的多尺度特征提取,建立不同地物目標的多維特征感知;通過分析不同地物目標在遙感影像中呈現(xiàn)的多維特征差異,刻畫色調(diào)、形狀、尺度、紋理等解譯標志,研究多尺度的深度特征解譯技術(shù)。在此基礎(chǔ)上結(jié)合多次迭代提取的解譯方案,以生成多尺度多維度的深度特征,實現(xiàn)多維感知解譯技術(shù)多尺度深度特征多維感知解譯技術(shù),實現(xiàn)在 0.5~30 m 分辨率國產(chǎn)遙感影像在不同尺度上聯(lián)合空間與光譜特征等多維度特征進行特征提取和感知。
多次迭代提取的解譯方案突破了深度特征解譯技術(shù),是從空間、時間與屬性等維度對圖斑的紋理信息、視覺形態(tài)和幾何特征進行多次迭代提取,并采用不同的深度特征融合策略,聚合多尺度的空譜特征,生成的高級語義信息,形成多層感知、多維特征融合的圖斑智能解譯技術(shù),用以生成多尺度多維度的深度特征,實現(xiàn)多維感知解譯技術(shù)。多次迭代提取的解譯方案可以提高解譯精度,適應(yīng)復(fù)雜數(shù)據(jù),充分利用先驗知識,處理噪聲和異常值,發(fā)現(xiàn)和利用潛在信息,并具有較好的靈活性和可擴展性。通過這種方式,多次迭代提取的解譯方案能夠?qū)崿F(xiàn)對圖斑的多層感知和多維特征融合。它不僅能夠捕捉到圖斑在不同尺度和維度上的特征,還能通過迭代機制逐步優(yōu)化解譯結(jié)果,提高解譯的準確性和效率。圖 6 為基于多尺度特征多維融合的深度特征解譯方法的結(jié)構(gòu)圖。
4.4 試驗結(jié)果及分析
本文設(shè)計了 FTUnetFormer 高分辨率遙感圖像語義分割模型,F(xiàn)TUNetFormer 采用了一種混合結(jié)構(gòu),具有基于 CNN 的編碼器和基于 Transformer 的解碼器,以實現(xiàn)實時性能。這種混合設(shè)計與其他編碼器 - 解碼器組合相比更具優(yōu)越性。此外,高效的全局 - 局部注意力模塊利用十字形窗口上下文交互模塊來替代移位窗口注意力,以捕捉跨窗口關(guān)系,進一步提升語義分割的性能和精度。該模型具有強大的全局上下文建模能力、多尺度特征融合、高效且靈活、適應(yīng)性強等優(yōu)點。
針對語義分割任務(wù)的深度學(xué)習(xí)網(wǎng)絡(luò),為評估其性能通常使用 3 個常用的指標:平均 F1 分數(shù)(mF1)、整體準確度(OA)和平均交并比(mIoU),而這 3 個指標則在測試集上通過混淆矩陣,以及基于混淆矩陣的精確率和召回率進行計算。
本文通過相同的硬件條件和軟件平臺下,將 FTUnetFormer 與 PSPNet, DeepLabV3, Segformer, Swin Transformer 及 DeepLabv3+Res2Net 這 5 種代表性的基于深度學(xué)習(xí)的語義分割網(wǎng)絡(luò)模型進行比對。
為了定量比較模型的性能,本文提出的高分辨率遙感圖像語義分割網(wǎng)絡(luò) FTUnetFormer 分割性能整體優(yōu)于其他模型,平均準確率 mAcc、平均交并比 mIoU 及 mF1 分別為 76.15%、64.30% 和 78.76%,整體性能超越其他 5 種模型。針對每一類的測試結(jié)果,F(xiàn)TUnetFormer 模型均略高于其他 5 種模型。特別地,在草地、水體、堆掘地、道路等類別上,F(xiàn)TUnetFormer 模型表現(xiàn)出色,分割結(jié)果高于其他模型,具有較明顯的優(yōu)勢。
5 結(jié)論
研建太原城區(qū)國產(chǎn)多源衛(wèi)片圖斑智能提取平臺,重點解決時空語義鴻溝、圖斑特征表達、深度特征解譯等技術(shù)問題,智能化提升圖斑提取的精度和計算復(fù)雜度,實現(xiàn)完全自主知識產(chǎn)權(quán)和多源海量國產(chǎn)遙感影像數(shù)據(jù)的統(tǒng)一管理。平臺的研建可以為山西省地理空間信息的快速獲取和動態(tài)監(jiān)測提供理論和技術(shù)支撐。平臺將在自然資源綜合評價、耕地非農(nóng)非糧化、礦產(chǎn)資源越界開采、生態(tài)環(huán)境評估、森林植被破壞監(jiān)測、自然災(zāi)害防治、城市規(guī)劃與管理等方面繼續(xù)開展應(yīng)用,提升衛(wèi)星遙感的產(chǎn)業(yè)附加值,有效推動黃河流域生態(tài)保護和高質(zhì)量發(fā)展,為山西省政治、經(jīng)濟、文化、生態(tài)、能源等各領(lǐng)域的行業(yè)用戶提供遙感應(yīng)用解決方案以及業(yè)務(wù)相關(guān)的遙感影像專題產(chǎn)品和服務(wù),促進政府部門監(jiān)管方式的轉(zhuǎn)變,大力提升服務(wù)效能,同時加速山西省衛(wèi)星遙感應(yīng)用產(chǎn)業(yè)社會化發(fā)展,取得良好的社會、經(jīng)濟和生態(tài)效益。
龐敏,山西省測繪地理信息院,202502