摘要:定位技術(shù)的飛速發(fā)展催生了時(shí)空軌跡大數(shù)據(jù),軌跡數(shù)據(jù)中往往存在著明顯偏離軌跡的異常點(diǎn)。檢測出軌跡中的異常點(diǎn)對(duì)提高數(shù)據(jù)質(zhì)量和后續(xù)軌跡數(shù)據(jù)挖掘精度至關(guān)重要。該文提出了一種基于雙向長短時(shí)記憶網(wǎng)絡(luò)(Bidirectional Long Short-Term Memory, Bi-LSTM)模型的軌跡異常點(diǎn)檢測算法。首先對(duì)每個(gè)軌跡點(diǎn)提取一個(gè)6維的運(yùn)動(dòng)特征向量,然后構(gòu)建了一個(gè)Bi-LSTM模型,模型輸入為一定序列長度的軌跡數(shù)據(jù)特征向量,輸出為軌跡點(diǎn)的類型結(jié)果。同時(shí),算法采用了欠采樣和過采樣的組合方法緩解類別不平衡對(duì)檢測性能的影響。融合了長短時(shí)記憶網(wǎng)絡(luò)單元和雙向網(wǎng)絡(luò),Bi-LSTM模型能夠自動(dòng)學(xué)習(xí)正常點(diǎn)和鄰近異常點(diǎn)在運(yùn)動(dòng)特征上的差異。基于真實(shí)船舶軌跡標(biāo)注數(shù)據(jù)的實(shí)驗(yàn)結(jié)果表明,該文算法的檢測性能顯著優(yōu)于恒定速度閾值法、不考慮數(shù)據(jù)時(shí)序性的經(jīng)典機(jī)器學(xué)習(xí)分類算法和卷積神經(jīng)網(wǎng)絡(luò)模型,尤其是召回率達(dá)到了0.902,驗(yàn)證了該文算法的有效性。
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社