掌握深度學習新突破|用 NotebookLM 一次看懂 DeepSeek mHC 論文的實用技巧

本篇以 NotebookLM 實測解讀 DeepSeek 最新論文 mHC:流行約束超連接。HC 缺乏約束導致訓練時訊號放大至3,000倍、風險失控;MHC 引入流行約束,透過加權平均穩定訊號並以雙隨機矩陣投影保障穩定性。實驗顯示 MHC 在多項基準超越基線與 HC,模型由 30 億增至 270 億,訓練成本僅增 6.7%,具高度可擴展性。