2025年3月13日,人工智能系列讀書班活動迎來了2025年第四場報告會,畢津滔博士做了“半監督學習”的研究内容分享,先介紹了針對未标注樣本的主動學習、半監督學習和直推學習,然後分析了生成式方法中的高斯混合模型、混合專家模型以及樸素貝葉斯模型,半監督SVM中的TSVM以及圖半監督學習中的标記傳播算法,最後讨論了基于分歧的方法,包括協同訓練算法、約束k均值算法、多視圖學習等:
圖 畢津滔博士主持“半監督學習”讨論會
自由讨論環節,大家讨論了多視圖學習、多模态學習,模态對齊,協同訓練方法等,半監督學習裡的混合專家模型,就是當前Deepseek等大模型采用的MOE技術,半監督學習在很多領域都是非常實用的;又讨論了當前大模型存在的問題,一個是幻覺問題的解決(高質量标注數據、模型微調、知識庫、知識圖譜等),以及大模型的預測下一個token的設計模式,對精準分類任務還是存在問題,應該結合有标注的高質量數據,對未标注的數據進行有效的自動标注,逐步形成高質量數據的篩選與标注,完成分類任務的精準化;最後又讨論了DeepSeek+Text-to-CAD、OpenSCAD、智能體等專業領域軟件結合的計劃等。
(總結:沈來信)