摘要:針對在蛋白質相互作用網絡上的關鍵蛋白質識別只關注拓撲特性,蛋白質相互作用數據中存在較高比例的假陽性數據以及基于復合物信息的關鍵蛋白質識別算法對節點的鄰域信息和復合物的挖掘對關鍵蛋白質的識別影響效果考慮不夠全面等導致的識別準確率和特異性不高的問題,提出一種基于復合物參與度和密度的關鍵蛋白質預測算法PEC。首先融合GO注釋信息和邊聚集系數構造加權PPI網絡,克服假陽性對實驗結果的影響;基于蛋白質相互作用的邊權重,構造相似度矩陣,設計特征值間的最大本征差值來自動確定劃分數目K,同時根據加權網絡中的蛋白質節點度來選取K個初始聚類中心,進而利用譜聚類結合模糊C-means聚類算法實現復合物的挖掘,提高聚類的準確率,降低數據的維數;其次基于蛋白質節點的復合物參與度以及節點鄰域子圖密度,設計出關鍵節點的關鍵性得分。在DIP和Krogan 2個數據集上,將PEC與DC、BC、CC、SC、IC、PeC、WDC、LIDC、LBCC和UC 10種經典算法相比,實驗結果表明,PEC算法能夠識別出更多的關鍵蛋白質,且聚類結果的準確率和特異性較高。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社