加载中...
文章
131
标签
260
分类
24
首页
时间轴
标签
分类
关于
Smarter's blog
搜索
首页
时间轴
标签
分类
关于
Transformer
分类 - Transformer
2026
2026-03-27
AI Infra学习之旅-RoPE、RMSNorm、GQA与MQA、SwiGLU与MoE
2026-03-27
AI Infra学习之旅-用PyTorch从零实现一个最小Transformer
2026-03-27
AI Infra学习之旅-手算一个完整TransformerBlock
2026-03-27
AI Infra学习之旅-手算一次 Transformer 的 Forward
2026-03-27
AI Infra学习之旅-从模型执行到推理系统的桥接
2026-03-27
AI Infra学习之旅-残差、LayerNorm与Encoder-Decoder全貌
2026-03-27
AI Infra学习之旅-Transformer为什么不只是一个Attention公式
2026-03-27
AI Infra学习之旅-Transformer最核心的计算机制
2026-03-27
AI Infra学习之旅-从序列建模到文本向量化
2026-01-04
AI Infra学习之旅-Transformer知识地图
1
2
Smarter
我就是要爬这座山
再见少年拉满弓,不惧岁月不惧风
文章
131
标签
260
分类
24
Follow Me
公告
路虽远,行则将至;事虽难,做则可成。
不积跬步,无以至千里;不积小流,无以成江海。
漫漫长途,终有回转;余味苦涩,终有回甘。
天下大事,必作于细;天下难事,必作于易。
不经一番寒彻骨,怎得梅花扑鼻香。
最新文章
AI Infra学习之旅-RoPE、RMSNorm、GQA与MQA、SwiGLU与MoE
2026-03-27
AI Infra学习之旅-用PyTorch从零实现一个最小Transformer
2026-03-27
AI Infra学习之旅-手算一个完整TransformerBlock
2026-03-27
分类
AI Agent
1
AI Infra
15
Transformer
11
CUDA-Practice
16
Clash
4
Claude code
1
Django开发
2
Modelica
1
标签
Transformer
注意力机制
深度学习
vLLM
LLM
PagedAttention
KV Cache
AI系统
AI Infrastructure
内存管理
RoPE
RMSNorm
MoE
大模型推理
推理优化
模型部署
学习路线
NLP
人工智能
LayerNorm
Ubuntu Server
RTX 4090
SSH
VSCode Remote
Python
LLM Serving
分布式推理
量化
CUDA
GPU编程
并行计算
系列导读
性能优化
Kaggle
GPU
高性能计算
Shared Memory
Tiling
Memory Bound
Roofline
归档
三月 2026
34
二月 2026
15
一月 2026
38
十二月 2025
7
十一月 2025
1
十月 2025
23
九月 2025
2
八月 2025
2
网站信息
文章数目 :
131
运行时间 :
本站总字数 :
458.1k
本站访客数 :
本站总浏览量 :
最后更新时间 :
搜索
数据加载中