摘要:目的應用不同機器學習算法預測男男性行為(MSM)人群HIV感染狀況的比較。方法將四種機器學習算法(logistic回歸、神經網絡、隨機森林和支持向量機)的預測結果和實驗室的檢測結果相比較,分類性能的評價指標采用ROC曲線下面積(AUC)、靈敏度、特異度和準確度(PRE)。結果四種算法在訓練集和測試集上均具有較理想的分類效能,訓練集的結果略好于測試集。和logistic回歸分析相比較,其他幾種算法均提高了分類預測效能:神經網絡提高18.4%(AUC:0.909,95%CI:0.903~0.915),隨機森林提高19.7%(AUC:0.922,95%CI:0.920~0.924),支持向量機提高22.3%(AUC:0.948,95%CI:0.947~0.949)。其中支持向量機的分類性能最好,分類的靈敏度為97.5%,特異度為99.1%,準確度(PRE)為98.9%。結論機器學習算法顯著地提高了MSM人群中HIV感染的預測效能,可以較準確地識別MSM人群中HIV感染者與未感染者,為及時地提供預防與治療服務提供了依據,同時避免了醫療資源的浪費。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社