LLM 底層技術探討錄 | 從 Mask 到 Mamba 混合架構 LLM Co … 閱讀全文 →
深入淺出 Kimi AttnRes:注意力殘差機制的數學與直覺 Kimi Att … 閱讀全文 →
解構 MHA:為什麼我們需要多頭注意力?
點我開啟
查看我的 HTML 頁面
互動式分析報告:OpenAI gpt-oss 模型 gpt-oss 分析報告 總 … 閱讀全文 →
強化學習演進之路 演進導航 介紹 第一章:與環境互動學習 Deep Q-Lear … 閱讀全文 →
深度強化學習的演化:從價值函數到世界模型與模仿學習 導論 深度強化學習(Deep … 閱讀全文 →
堪察加半島地震與海嘯互動式分析 Mww 8.8 堪察加地震分析 總覽 地震週期 … 閱讀全文 →
大型語言模型架構演進史 LLM 架構演進史 開端:Encoder-Decoder … 閱讀全文 →