作者彙整: wesley91345@gmail.com

LLM 因果注意力

發佈日期: 23 3 月, 2026，作者: wesley91345@gmail.com

LLM 底層技術探討錄 | 從 Mask 到 Mamba 混合架構 LLM Co … 閱讀全文 →

分類: Uncategorized | 發佈留言

Kimi Attnres

發佈日期: 23 3 月, 2026，作者: wesley91345@gmail.com

深入淺出 Kimi AttnRes：注意力殘差機制的數學與直覺 Kimi Att … 閱讀全文 →

分類: Uncategorized | 發佈留言

解構 MHA：為什麼我們需要多頭注意力？

發佈日期: 15 12 月, 2025，作者: wesley91345@gmail.com

解構 MHA：為什麼我們需要多頭注意力？

分類: Uncategorized | 發佈留言

thread vs asyncio

發佈日期: 8 8 月, 2025，作者: wesley91345@gmail.com

點我開啟

分類: Uncategorized | 發佈留言

為什麼 e 是最有效率的進位系統？

發佈日期: 8 8 月, 2025，作者: wesley91345@gmail.com

查看我的 HTML 頁面

分類: Uncategorized | 發佈留言

Openai 最新開源AI模型 gpt-oss

發佈日期: 6 8 月, 2025，作者: wesley91345@gmail.com

互動式分析報告：OpenAI gpt-oss 模型 gpt-oss 分析報告總 … 閱讀全文 →

分類: Uncategorized | 發佈留言

The Evolution of Reinforcement Learning

發佈日期: 1 8 月, 2025，作者: wesley91345@gmail.com

強化學習演進之路演進導航介紹第一章：與環境互動學習 Deep Q-Lear … 閱讀全文 →

分類: Uncategorized | 發佈留言

深度強化學習的演化

發佈日期: 31 7 月, 2025，作者: wesley91345@gmail.com

深度強化學習的演化：從價值函數到世界模型與模仿學習導論深度強化學習（Deep … 閱讀全文 →

分類: Uncategorized | 發佈留言

堪察加半島地震與海嘯

發佈日期: 31 7 月, 2025，作者: wesley91345@gmail.com

堪察加半島地震與海嘯互動式分析 Mww 8.8 堪察加地震分析總覽地震週期 … 閱讀全文 →

分類: Uncategorized | 發佈留言

mor vs transformer

發佈日期: 30 7 月, 2025，作者: wesley91345@gmail.com

互動分析：Mixture-of-Recursions vs. Transform … 閱讀全文 →

分類: llm | 發佈留言

作者彙整: wesley91345@gmail.com

LLM 因果注意力

Kimi Attnres

解構 MHA：為什麼我們需要多頭注意力？

thread vs asyncio

為什麼 e 是最有效率的進位系統？

Openai 最新開源AI模型 gpt-oss

The Evolution of Reinforcement Learning

深度強化學習的演化

堪察加半島地震與海嘯

mor vs transformer

Recent Posts

Recent Comments

Archives

Categories