摘要:[目的/意義]對社交媒體中熱門新聞的及時識別,有助于加速正面資訊的投送或抑制負面資訊的擴散。當前,基于自然語言處理的傳統識別方法正面臨社交媒體新生態的挑戰:大量新聞內容以圖片、音視頻形式存在,缺乏用于語義及情感分析的文本。[方法/過程]對此,本文首先將社交網絡劃分為眾多社群,并按其層次結構組織為貝葉斯網絡。接著,面向社群構建基于卷積神經網絡的熱門新聞識別模型,模型綜合考慮新聞傳播的宏觀統計規律及微觀傳播過程,以提取社群內熱門新聞傳播的特征。最后,利用貝葉斯推理并結合局部性的模型識別結果進行全局性熱度預測。[結果/結論]實驗表明,本方法在語義缺失場景下可有效識別熱門新聞,其準確度強于基于語義信息的機器學習方法,模型具有良好的時效性、可擴展性和適用性。該研究有助于社交媒體的監管機構及時識別出各類不含語義信息且迅速擴散的熱點內容。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社