摘要:弱監督機器學習算法解決標簽模糊類的問題具有更好的優勢,該類算法緩解了數據標簽的精度要求。病案的相似性度量就是這類問題,其對醫療數據的應用有著極其重要的基礎性作用。鑒于現有病案相似性度量算法通常只基于病理關系的理論規則模型提出,忽略了數據本身包含的信息,文中提出一種弱監督機器學習算法應用于病案相似性度量。該算法首先基于多指標概率分配的方法進行病案組的構建,避免陷入局部最優的情況;然后根據理論模型進行標簽賦值,充分利用理論信息;最后通過輸入、損失函數、學習模型的分析,從機器學習的角度進行病案的相似性度量。與經典病案相似性度量算法相比,該算法提高了病案相似性度量的準確性,解決了高成本標簽的問題。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社