加载中...
vLLMLLMPagedAttentionKV CacheAI系统AI Infrastructure内存管理大模型推理Transformer推理优化模型部署Ubuntu ServerRTX 4090SSHVSCode RemoteLLM Serving分布式推理量化MoECUDAGPU编程并行计算系列导读学习路线性能优化高性能计算Shared MemoryTilingMemory BoundRooflineGEMMKaggleGPURegister Tiling外积Thread CoarseningcuBLASSoftmaxLayerNormRMSNormRoPEFlashAttentionWelford算法Prefix SumScanKogge-StoneBrent-KungWarp Shuffle寄存器通信归约算法前缀和ReduceWarp DivergenceFMAFP16INT8dp4a混合精度VectorizedMulti-StreamCUDA GraphsPyTorch ExtensionPipelineC++ ExtensionTensor CoreWMMACoalesced AccessBank ConflictAsync CopyAoSSoAPaddingKernel FusionContinuous BatchingCUTLASSCuTeTemplate Metaprogramming模板元编程Multi-GPUNCCLAllReduceRing Topology分布式训练梯度同步PCIeNVLinkRoofline ModelOccupancyILPNsight Compute性能分析Compute BoundAscend C算子开发cuFFTThrust标准库FFT并行算法PyTorch深度学习PythonAMPTorch CompileONNXCUDA入门编程模型执行模型全局内存共享内存内存合并原子操作并发占用率WarpGPU架构核函数面试PTXTritonSASS矩阵乘法性能剖析调试TensorRT-LLM多GPUKernel 开发系统设计PrefillDecodeSSE流式输出模型服务FastAPIASGIOpenAI-Compatible APIHTTP APIOpenAI 兼容Mini Infer推理系统Preemptionchunked prefillPrefix Cachingspeculative decodingCUDA GraphFlash DecodingTensor ParallelismPD 解耦多进程MLAExpert ParallelismGrouped Execution注意力机制NLP人工智能OpenAI TritonNVIDIA TritonLinux算子融合自动调优Triton Inference Server动态批处理Perf Analyzer性能压测最佳实践项目落地系统架构SchedulerTTFTITLLLMEngineAsyncLLMEngine调用链多租户安全Worker推理执行链部署调优推理加速张量并行流水线并行源码结构TGISGLang系统选型瓶颈定位LeetCodeC++KMP字符串匹配动态规划数据结构Kadane最大子数组和贪心DP算法设计分治二分查找搜索位运算二进制算法技巧归并排序快速排序单调栈数组多维DP回溯DFS递归剪枝快速选择二叉树BFS优先队列前缀树Trie字符串数学质数最大公约数链表双指针Java拓扑排序区间排序读书笔记N皇后剪枝优化移植异构计算并行计算入门线程束内存对齐合并访问常量内存bank冲突CUDA流事件指令级原语warp洗牌循环展开OpenACCP2PMPIPMPP全书导读卷积图像处理直方图私有化动态并行递归算法四叉树未来趋势集群计算分布式计算向量加法模板计算Stencil工作效率MRI医学影像迭代重建基数排序计算思维方法论归并Merge动态数据识别图算法CSR格式分子动力学静电势能科学计算稀疏矩阵SpMV归约分支发散卷积神经网络cuDNNEffective Modern C++C++11C++14现代C++类型推导移动语义完美转发Modelica仿真综合仿真平台开发SimulinkMatlab计算机系统系统编程操作系统CSAPPClaude CodeCodexcc-connect飞书机器人AgentHook自动化Windows通知GitGitHub版本控制工程协作Pull RequestClashMihomo代理ShellTUN校园网深澜网络监控脚本开机自启ProxifierVSCode插件

评论
avatar
Smarter
我就是要爬这座山
再见少年拉满弓,不惧岁月不惧风
Follow Me
公告
路虽远,行则将至;事虽难,做则可成。
不积跬步,无以至千里;不积小流,无以成江海。
漫漫长途,终有回转;余味苦涩,终有回甘。
天下大事,必作于细;天下难事,必作于易。
不经一番寒彻骨,怎得梅花扑鼻香。