UCIE Controller

Mar 23, 2026 读书笔记, UCIE

UCIE协议

3.0 Adapter 这是链路的初始化，stage2是RDI -> Active结束。 stage3主要在参数Exchange阶段协商在给定phy速率下是否需要retry；其余参数交换参考3.2.1.2；FDI bring up 3.3 68B flit的对齐问题 Adapter在RDI / 链路侧传输连续flit时按 256B 倍数组织数据如果 Retry 或者 R...

Mar 20, 2026 读书笔记, UCIE

c++

模板函数 template<typename Op> uint16_t SoftmaxCore_Model::reduction_tree_op(const std::vector<uint16_t>& vector, Op op) { std::vector<uint16_t> nodes = vector; while (no...

Dec 7, 2025 tools, c++

线性代数基础

矩阵的理解：(1)函数 (2)基向量对于标准基下的列向量a，要求他在以A为基的坐标向量，$x=A^{-1}$a 特征分解：利用矩阵对特征向量变换只进行缩放的性质来简化计算 PCA 主成分分析算法讲解

Oct 30, 2025 项目学习, 算法

cuda

GPU的内存结构影响硬件效率的原因 warp中的线程进入不同的分支，效率就会变低！（1个warp=32线程）

Sep 21, 2025 tools, cuda

ong-context LLM

Long-Context LLM papers: LongLoRA: Efficient Fine-Tuning of Long-Context

Sep 14, 2025 读书笔记, 资料检索

C++多线程

前情提要给自己新开一个c++多线程的坑，先放一点资料认识一些多线程和同步原语，但是这个教程真的只能入门，除了带你认识这些原语外几乎不能帮助你任何事情先去把中大os的那几个讲多线程的课快速过一遍（然后做一做那几周的实验，实验很简单以观察程序行为为主），然后做一做这个bootcamp（还是以观察程序行为为主）。有了这个你对多线程就有了初步的认识了 jyy 的 lab 1...

Jul 24, 2025 读书笔记, 资料检索

speculative-decode

1. 整体结构 samd_model.generate ： prefill，draft.update 2. 零散部件 1.1 SAM自动后缀机理解后缀自动机 SAM 最多2n-1个点 3n-4 边，endpos代表字符串出现的不同位置后缀链接link：第一个断开的后缀，比如ababc 状态存在babc，不存在abc，那么link连向abc状态 `...

Jun 28, 2025 读书笔记, 资料检索

llamacpp

参考文档，资料汇总 ggml 简介,gg本人写的博客 llama.cpp源码解读–cgraph计算图与sched后端调度机制详解 RISC-V Base Vector Extension Document 在线Intrinsics 博客记录 llama.cpp k系列量化方法代码解析- 知乎一点C++基础 struct simple_model { /...

Jun 11, 2025 读书笔记, 资料检索

编译器+AI

1. llama.cpp typedef struct llama_batch { int32_t n_tokens; llama_token * token; float * embd; llama_pos * pos; int32_t * n_seq_id; //共享于多少个序列 llama_seq_id ** seq_i...

May 22, 2025 读书笔记, 资料检索