beplay2網頁登錄
beplay2網頁登錄
山西大學人工智能研究團隊在譜聚類研究方麵取得重要進展
2023-04-25 18:09:00
山西大學

  近期,山西大學人工智能研究團隊在自學習譜聚類的理論與方法研究中取得重要進展,相關成果《Spectral Clustering with Robust Self-Learning Constraints》已發表在人工智能領域國際頂級期刊Artificial Intelligence上。該論文通訊作者為梁吉業教授,第一作者為白亮教授,合作者為2021級博士生祁敏學。

  譜聚類是一種極具代表性的無監督機器學習範式,其相關技術已在計算機視覺、社交網絡、精準醫療等領域取得了巨大的成功。然而,現有譜聚類模型更多強調學習無標記數據之間的一致性去探索數據的潛在類結構,忽略了它們的判別性對訓練無監督模型的重要性。通過大量實驗發現少量帶有判別性的先驗信息的介入可以極大地提升模型在分類任務上的表現。然而,從無標記數據中獲取這些先驗信息是極其困難的。此外,先驗信息的準確性對模型影響巨大,錯誤的先驗信息往往會嚴重影響模型的性能。如何從無標記數據中自學習高質量的判別信息去提升模型的有效性是一項具有挑戰性的任務。

圖1 高魯棒的自學習譜聚類模型框架

  針對這一挑戰,研究團隊提出了高魯棒的自學習譜聚類模型(見圖1)。該模型借鑒集成學習的思想,從無標注數據中自學習多組監督信息,通過求解它們之間的最大一致性去增強譜聚類模型的判別性。相比現有方法,新模型能夠學到更加魯棒的監督信息和聚類結果,並通過大量實驗對比驗證了它的有效性(見圖2)。

圖2 模型和現有方法的有效性比較

  同時,團隊提供了該模型的相關理論分析:(1)從泛化性的角度出發,證明了自學習的判別信息能夠提升譜聚類模型的泛化能力。(2)從穩定性角度出發,證明了自學習多組監督信息相比單組監督信息能夠幫助譜聚類模型得到更加魯棒的聚類結果。(3)從收斂性的角度出發,證明了該模型能夠在有限次迭代中收斂。

圖3 模型的理論分析

  研究工作得到了科技創新2030-“新一代人工智能”重大項目、國家優秀青年科學基金、山西省1331工程重點學科建設計劃的支持。

研究成果原文閱讀鏈接

https://doi.org/10.1016/j.artint.2023.103924

免責聲明:

① 凡本站注明“稿件來源:beplay2網頁登錄”的所有文字、圖片和音視頻稿件,版權均屬本網所有,任何媒體、網站或個人未經本網協議授權不得轉載、鏈接、轉貼或以其他方式複製發表。已經本站協議授權的媒體、網站,在下載使用時必須注明“稿件來源:beplay2網頁登錄”,違者本站將依法追究責任。

② 本站注明稿件來源為其他媒體的文/圖等稿件均為轉載稿,本站轉載出於非商業性的教育和科研之目的,並不意味著讚同其觀點或證實其內容的真實性。如轉載稿涉及版權等問題,請作者在兩周內速來電或來函聯係。

相關新聞