時間: 分類:電子論文 瀏覽次數(shù):
摘要:針對大范圍內(nèi)住宅建筑圖斑自動識別較為困難的問題,該文提出基于決策樹模型的分類方法,利用基礎(chǔ)測繪中高精度的建筑數(shù)據(jù)、地理省情監(jiān)測數(shù)據(jù)、POI數(shù)據(jù)、DSM、DEM、騰訊大數(shù)據(jù)等,以建筑物本身特征和建筑物不同鄰域內(nèi)建筑類型相關(guān)因素的空間特征作為決策變量,分別采用QUEST、CHAID、C&RT和C5.0算法構(gòu)建用于住宅分類識別的決策樹模型并進(jìn)行優(yōu)選。以濟(jì)南市(不含原萊蕪市)為研究區(qū)域進(jìn)行了實(shí)驗(yàn),結(jié)果顯示4個模型均未出現(xiàn)過擬合現(xiàn)象,可以用于住宅建筑圖斑識別。
關(guān)鍵詞:住宅建筑;周邊特征;決策樹模型;C5.0;混淆矩陣;接受者操作性能曲線
0引言
近年來,隨著我國社會經(jīng)濟(jì)的不斷發(fā)展,城市化進(jìn)程進(jìn)一步快速推進(jìn),尤其是城市地區(qū)土地利用類型中建設(shè)用地呈現(xiàn)增長趨勢。房屋建筑是人類活動最主要的場所,其數(shù)據(jù)信息在城市規(guī)劃[1]、人口估計[2]、應(yīng)急救援與災(zāi)害評估[3]等方面的應(yīng)用中都具有極其重要的意義。
目前對于建筑物的提取研究已有多年,方法也較為成熟,主要方法有以下方面:基于模板匹配的地物提取方法[4]、基于知識的目標(biāo)提取方法[5]、基于面向?qū)ο蠹夹g(shù)的方法[6]、基于知識和面向?qū)ο笙嘟Y(jié)合的方法[7]、基于機(jī)器學(xué)習(xí)的方法[8-9]等。其中,基于機(jī)器學(xué)習(xí)的方法是近些年來研究的重點(diǎn)和熱點(diǎn),常見的方法有決策樹分類、基于規(guī)則分類、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(supportvectormachine,SVM)和樸素貝葉斯分類等[10]。以上研究均為基于遙感數(shù)據(jù)的建筑物識別,主要目的是為了提取出建筑物數(shù)據(jù),而對于建筑物更進(jìn)一步的詳細(xì)類型則沒有進(jìn)行劃分。
而建筑物中的住宅與人類生活息息相關(guān),其分布和位置以及周邊設(shè)施等直接影響居民的生活質(zhì)量,如果能獲取精細(xì)住宅建筑數(shù)據(jù),那么對于居民生活環(huán)境分析、基礎(chǔ)設(shè)施均衡化評價、常住人口分布、政府規(guī)劃決策等方面提供精準(zhǔn)有效的輔助支撐。目前,對于住宅建筑的識別也有一些研究,文獻(xiàn)[2]基于建筑物三維空間分布數(shù)據(jù),運(yùn)用面向?qū)ο蠓诸惙椒ㄌ蕹亲≌ㄖ铮玫阶≌ㄖ植紨?shù)據(jù);文獻(xiàn)[11]中通過對遙感影像進(jìn)行目視解譯,通過矢量化方法提取居住建筑圖斑。這些方法都停留在結(jié)合地圖和實(shí)地調(diào)查或者影像的目視解譯層面,提取數(shù)據(jù)效率低,人工工作量大,不適于大范圍區(qū)域。近些年,我國的基礎(chǔ)測繪建設(shè)逐漸完善,成果資源豐碩,對于海量數(shù)據(jù)的深度挖掘與應(yīng)用也是近些年測繪行業(yè)關(guān)注和探索的重點(diǎn)。
本次研究以山東省濟(jì)南市(不包含原萊蕪市)范圍內(nèi)基礎(chǔ)測繪中高精度的建筑基底圖斑數(shù)據(jù)為基礎(chǔ),結(jié)合地理省情監(jiān)測數(shù)據(jù)、興趣點(diǎn)(pointofinformation,POI)數(shù)據(jù)、數(shù)字地表模型(digitalsurfacemodel,DSM)、數(shù)字高程模型(digitalelevationmodel,DEM)、騰訊大數(shù)據(jù)等,按照城市和農(nóng)村不同區(qū)域,實(shí)現(xiàn)住宅建筑識別,探討和研究濟(jì)南市住宅建筑圖斑高效提取方法及其分布形態(tài)。由于具有可讀性、分類速度快、能夠生成分類規(guī)則集等優(yōu)點(diǎn),因此本研究選擇決策樹算法進(jìn)行建模。
1研究區(qū)域
濟(jì)南市位于山東省中部,是山東省省會城市,地理位置介于36°01′~37°32′N,116°11′~117°44′E,面積7998km2;南部為泰山山地,北部為黃河平原,背山面水,地勢南高北低,地形復(fù)雜多樣[12]。
2018年年底濟(jì)南市常住人口746.04萬人,戶籍人口655.90萬人,全市地區(qū)生產(chǎn)總值7856.56億元[13]。濟(jì)南市地表覆蓋類型以種植業(yè)為主,其次為林草覆蓋和房屋建筑(區(qū)),房屋建筑(區(qū))主要集中在濟(jì)南市中部低海拔平原地區(qū)。2019年1月,原萊蕪市所轄區(qū)域劃歸濟(jì)南市,由于本次研究數(shù)據(jù)現(xiàn)勢性主要為2018年,所以研究區(qū)域?yàn)槲催M(jìn)行行政區(qū)劃調(diào)整前的濟(jì)南市范圍。
2數(shù)據(jù)來源
2.1基礎(chǔ)測繪數(shù)據(jù)
基礎(chǔ)測繪數(shù)據(jù)是測繪行業(yè)最全面、基礎(chǔ)的數(shù)據(jù)成果,特別是及時更新矢量數(shù)據(jù),已經(jīng)實(shí)現(xiàn)每年甚至更短時間的更新頻率,具有較強(qiáng)的現(xiàn)勢性。本文采用基礎(chǔ)測繪及時更新數(shù)據(jù)中的建筑基底面狀數(shù)據(jù)作為基礎(chǔ)數(shù)據(jù);此外,POI數(shù)據(jù)是最重要的輔助數(shù)據(jù)。數(shù)據(jù)現(xiàn)勢性為2018年。
2.2地理省情監(jiān)測數(shù)據(jù)采用房屋建筑(區(qū))和城鎮(zhèn)綜合功能單元、城市空間格局?jǐn)?shù)據(jù)。數(shù)據(jù)現(xiàn)勢性為2018年6月30日。
2.3激光點(diǎn)云數(shù)據(jù)和DEM數(shù)據(jù)利用激光點(diǎn)云數(shù)據(jù)中的DSM數(shù)據(jù),結(jié)合DEM數(shù)據(jù),可以獲取建筑物高度信息。DSM和DEM現(xiàn)勢性分別為2014年、2015年。
2.4騰訊位置大數(shù)據(jù)社交位置數(shù)據(jù)與人類活動有很強(qiáng)的相關(guān)性,獲取騰訊大數(shù)據(jù)平臺上濟(jì)南市范圍內(nèi)社交位置數(shù)據(jù),按照白天和晚上不同時段進(jìn)行獲取,即從一定程度上可以反映人為活動及聚集密度。數(shù)據(jù)現(xiàn)勢性為2018年7月。
3研究方法
濟(jì)南市建筑物圖斑約1.6×106個,涵蓋住宅、工商企業(yè)、機(jī)關(guān)單位、公共設(shè)施等類別的建筑物,還包括一些附屬建筑和臨時性建筑。本次研究目的主要為從海量建筑基底圖斑中識別出住宅建筑圖斑數(shù)據(jù),因此對于非住宅類的建筑數(shù)據(jù)不再進(jìn)行詳細(xì)劃分。而由于不同區(qū)域住宅建筑在形狀、高度、聚集情況等有所差異,需要按照區(qū)域及住宅不同的類型建立多層次的分類系統(tǒng)。
3.1特征變量選擇
用于住宅識別的變量首先應(yīng)當(dāng)包括建筑物自身的屬性特征,包括幾何屬性和通過其他數(shù)據(jù)獲取的屬性。此外,地理學(xué)第一定律和地理學(xué)第二定律分別說明了事物的空間相關(guān)性和空間異質(zhì)性,本文引入了大量的周邊空間特征變量,根據(jù)住宅建筑自身及周邊位置事物之間的關(guān)系特征進(jìn)行識別。
3.1.1建筑物圖斑特征
建筑物圖斑特征即建筑物圖斑自身特征,包括建筑自身的幾何特征和由其他數(shù)據(jù)確定的屬性特征。幾何特征變量主要有:層數(shù)、面積、周長、節(jié)點(diǎn)數(shù)、朝向(與正北方向夾角)、長寬、形狀因子等。
3.2決策樹分類算法模型選取
決策樹模型是通過訓(xùn)練形成一組決策規(guī)則并且可以對未知對象進(jìn)行預(yù)測或分類的樹狀系統(tǒng),它主要包括兩個階段:分裂和剪枝。決策樹的構(gòu)建過程是一種從上向下、遞歸分治的過程,先根據(jù)特征變量選擇最有效的樣本集劃分方式,形成新的決策分支;后對分支進(jìn)行修剪來優(yōu)化決策樹。常見的決策樹分類算法有以下方面。
1)卡法自動交互檢測算法(chi-squaredautomaticintera-ctiondetector,CHAID)。CHAID[14]算法是一種使用卡方統(tǒng)計選擇特征變量(卡方值最顯著特征),從而建立決策樹的分類方法,其特征變量選擇和分支點(diǎn)選擇同時進(jìn)行。剪枝策略為預(yù)剪枝。2)快速無偏有效的統(tǒng)計樹(quickunbiasedefficientstat-isticaltree,QUEST)。QUEST[15]算法是對CHIAD的改進(jìn),該算法將特征變量選擇和分支點(diǎn)選擇分開進(jìn)行。如果特征變量為分類變量,則采用卡方檢驗(yàn);如果特征變量為有序或連續(xù)變量,則使用F檢驗(yàn);選擇P值最小且小于顯著水平α的特征變量作為當(dāng)前最佳分支變量。剪枝策略為后剪枝。
4結(jié)果與分析
4.1決策樹分類模型精度評價
采用決策樹分類模型,對城區(qū)、農(nóng)村分區(qū)域進(jìn)行建模,訓(xùn)練集、驗(yàn)證集的混淆矩陣正確率。可以看出,4個決策樹分類模型中,C5.0模型的精度最高。訓(xùn)練集、測試集精度分別為城區(qū)96.6%、94.81%,農(nóng)村97.73%、95.14%。農(nóng)村地區(qū)模型略優(yōu)于城區(qū)。其他3類模型精度差異不大,均未超過90%,遠(yuǎn)低于C5.0模型。所以C5.0模型更適用于建筑物識別分類。
5結(jié)束語
本文利用測繪行業(yè)多源、多尺度數(shù)據(jù),基于多種決策樹模型,實(shí)現(xiàn)濟(jì)南市城市和農(nóng)村不同區(qū)域建筑物圖斑分類識別,并且對模型結(jié)果做精度比對評價,實(shí)現(xiàn)了對測繪大數(shù)據(jù)的有效挖掘,同時也拓寬了現(xiàn)有地理信息數(shù)據(jù)的維度,對地理省情監(jiān)測統(tǒng)計分析等應(yīng)用工作進(jìn)行了有效的探索。
計算機(jī)論文范例:計算機(jī)應(yīng)用技術(shù)與信息管理的整合
主要結(jié)論如下:本文用于建筑物圖斑識別的變量除了建筑物自身屬性特征外,結(jié)合地理學(xué)第一定律,引入了周邊不同緩沖空間范圍內(nèi)其他影響因地區(qū)和農(nóng)村地區(qū)分類特征變量重要性進(jìn)行分析,城市地區(qū)建筑物圖斑識別特征變量重要性前6位依次為:層高、地表覆蓋類型、節(jié)點(diǎn)數(shù)、周邊100m內(nèi)建筑物數(shù)量、周邊50m建筑物數(shù)量、寬等;而農(nóng)村地區(qū)依次為周邊50mPOI數(shù)、地表覆蓋類型、距離辦公商業(yè)最近距離、距離交通運(yùn)輸點(diǎn)距離、面積、周邊50m道路總段數(shù)等。
可以看出:城市和農(nóng)村用于識別的特征變量有較大差別,城市地區(qū)特征變量貢獻(xiàn)比較大的為建筑物自身特征,說明城市住宅和非住宅建筑物細(xì)節(jié)特征差異比較明顯;而農(nóng)村地區(qū)建筑自身細(xì)節(jié)差別較小,需要依據(jù)周邊特征幫助區(qū)分。
參考文獻(xiàn)
[1]李垚,趙衛(wèi)東,衛(wèi)剛.城市規(guī)劃建筑圖紙電子報批系統(tǒng)實(shí)施與關(guān)鍵技術(shù)[J].計算機(jī)應(yīng)用,2007,27(S2):242-243.(LIYao,ZHAOWeidong,WEIGang.Implementationandkeytechnologyofelectronicapprovalsystemforurbanplanningandbuildingdrawings[J].JournalofComputerApplications,2007,27(S2):242-243.)
[2]卓莉,黃信銳,陶海燕,等.基于多智能體模型與建筑物信息的高空間分辨率人口分布模擬[J].地理研究,2014,33(3):520-531.(ZHUOLi,HUANGXinrui,TAOHaiyan,etal.Highspatialresolutionpopulationdistributionsimulationbasedonbuildinginformationandmulti-agent[J].GeographicalResearch,2014,33(3):520-531.)
[3]眭海剛,劉超賢,黃立洪,等.遙感技術(shù)在震后建筑物損毀檢測中的應(yīng)用[J].武漢大學(xué)學(xué)報(信息科學(xué)版),2019,44(7):1008-1019.(SUIHaigang,LIUChaoxian,HUANGLihong,etal.Applicationofremotesensingtechnologyinearthquake-inducedbuildingdamagedetection[J].GeomaticsandInformationScienceofWuhanUniversity,2019,44(7):1008-1019.)
作者:牛宵
級別:北大核心,CSSCI,AMI擴(kuò)展
ISSN:1002-6487
刊期:進(jìn)入查看
格式:咨詢顧問
級別:北大核心,JST,CSSCI,WJCI,AMI權(quán)威
ISSN:1002-4565
刊期:進(jìn)入查看
格式:咨詢顧問
級別:北大核心,JST,CSCD,CSSCI,WJCI
ISSN:1002-2104
刊期:進(jìn)入查看
格式:咨詢顧問
級別:北大核心,CSSCI,AMI權(quán)威,社科基金資助期刊,
ISSN:1003-1707
刊期:進(jìn)入查看
格式:咨詢顧問
數(shù)據(jù)庫:SCI
ISSN:2045-2322
刊期:進(jìn)入查看
格式:咨詢顧問
數(shù)據(jù)庫:SCI
ISSN:0284-1851
刊期:進(jìn)入查看
格式:咨詢顧問
數(shù)據(jù)庫:SCI
ISSN:2352-4928
刊期:進(jìn)入查看
格式:咨詢顧問
數(shù)據(jù)庫:SCI
ISSN:0169-4332
刊期:進(jìn)入查看
格式:咨詢顧問
數(shù)據(jù)庫:SCI
ISSN:0960-7412
刊期:進(jìn)入查看
格式:咨詢顧問