Notes

CS336 学习笔记之第二讲：PyTorch 与资源计算

本文是 CS336 系列笔记的第二讲，PyTorch 与资源计算。本讲比较简单，从两个问题出发，讨论如何计算计算量，并顺带讲一些 PyTorch 的入门概念。本讲的重点不...

CS336 学习笔记之第一讲：总览与分词器

本文是 CS336 第一讲的学习笔记，主要介绍开设这门课程的背景和动机，并对课程主要内容做了概览。还介绍了不同的分词器基本原理及其优缺点。引入为什么要学...

MIT 6.5940 EfficientML Lab 2 实验笔记

本文为 EfficientML Lab 2 实验笔记，包含 K-Means 量化、K-Means QAT、线性量化等内容，难度不大，内容丰富。 Part 1: K-Means Quantization Qustion 1 第一个问题是实现 K-means 量化的核心算法，其...

MIT 6.5940 EfficientML 第六讲学习笔记

本文介绍了训练后量化（PTQ）和量化感知训练（QAT）技术，PTQ 通过 Per-Tensor/Channel/Vector 等不同粒度划分量化参数，结合动态范围裁剪（校准集统计或 KL 散度优化）和...

百度飞桨「启航计划」小结——CINN后端Pass改造

在过去八周时间里，我参加了由飞桨开源社区组织的飞桨启航计划集训营（第四期），认领并完成【开源任务】CINN编译器后端Pass改造系列任务。趁...

MIT 6.5940 EfficientML Lab 1 实验笔记

实验准备 Python 环境需要用到如下 Python 环境： PyTorch GPU 版本 jupyter notebook tqdm matplotlib torchprofile 数据集准备 Lab 1 中用到了 CIFAR-10 数据集，可以使用 https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz 直接下载，并将整个 cifar-10-batched-py 文件夹解压到 data/cifar10 文件夹内。 Part...

MIT 6.5940 EfficientML 第五讲学习笔记

本讲开始介绍量化技术，首先介绍各种数据表示格式，然后介绍了两种量化技术：K-means和线性量化，最后提到了模型压缩的流水线。数值数据类型课...

如何在VSCode中“优雅”地配置CMake —— 以PaddlePaddle为例

通过本文，你将了解如何在 VSCode 中配置 CMake 项目，包括但不限于语法高亮、代码跳转、CMake 配置、构建、测试。环境说明本文使用 WSL Ubuntu 22.04 作为演示环境，VS...

MIT 6.824 Distributed Systems Spring 2023 第三讲学习笔记

MIT 6.824 Distributed Systems 第三讲学习笔记，简单介绍了存储系统和一致性，主要介绍了 GFS 中的文件读写流程。存储系统概述存储系统在分布式系统中相当重要：如果能够建立一...

MIT 6.5940 EfficientML 第四讲学习笔记

本讲延续上一讲继续介绍了两种确定剪枝比例的算法：灵敏度分析和强化学习。此外还介绍了为稀疏网络提供支持的硬件加速器，包括 EIE、NVIDIA Tensor...