作者彙整: wesley91345@gmail.com

LLM 因果注意力

LLM 底層技術探討錄 | 從 Mask 到 Mamba 混合架構 LLM Co … 閱讀全文

分類: Uncategorized | 發佈留言

Kimi Attnres

深入淺出 Kimi AttnRes:注意力殘差機制的數學與直覺 Kimi Att … 閱讀全文

分類: Uncategorized | 發佈留言

解構 MHA:為什麼我們需要多頭注意力?

解構 MHA:為什麼我們需要多頭注意力?

分類: Uncategorized | 發佈留言

thread vs asyncio

點我開啟

分類: Uncategorized | 發佈留言

為什麼 e 是最有效率的進位系統?

查看我的 HTML 頁面

分類: Uncategorized | 發佈留言

Openai 最新開源AI模型 gpt-oss

互動式分析報告:OpenAI gpt-oss 模型 gpt-oss 分析報告 總 … 閱讀全文

分類: Uncategorized | 發佈留言

The Evolution of Reinforcement Learning

強化學習演進之路 演進導航 介紹 第一章:與環境互動學習 Deep Q-Lear … 閱讀全文

分類: Uncategorized | 發佈留言

深度強化學習的演化

深度強化學習的演化:從價值函數到世界模型與模仿學習 導論 深度強化學習(Deep … 閱讀全文

分類: Uncategorized | 發佈留言

堪察加半島地震與海嘯

堪察加半島地震與海嘯互動式分析 Mww 8.8 堪察加地震分析 總覽 地震週期 … 閱讀全文

分類: Uncategorized | 發佈留言

mor vs transformer

互動分析:Mixture-of-Recursions vs. Transform … 閱讀全文

分類: llm | 發佈留言