Archive

2025
- 20 Oct
  论文阅读：LiNeS Post-Training Layer Scaling Prevents Forgetting and Enhances Model Merging
- 20 Oct
  CLIP：Contrastive Language-Image Pre-Training
- 13 Oct
  梯度、黑塞矩阵
- 12 Oct
  期望、方差、协方差
- 05 Oct
  论文阅读：SFT Memorizes, RL Generalizes
- 04 Oct
  论文阅读：Unlearning-Based Neural Interpretations
- 02 Oct
  Hugging Face Datasets 库核心用法
- 01 Oct
  Peft 库：LoRA 对网络模型结构的修改
- 01 Oct
  论文阅读：PINNs for PTV
- 01 Oct
  lm_eval 库简介
- 01 Oct
  代码阅读：KL 散度正则项计算
- 29 Sep
  Learning Dynamics of LLM Fine-Tuning
- 28 Sep
  神经正切核 Neural Tangent Kernel, NTK
- 24 Sep
  线性可控性 Linearized Controllability Property LPC
- 24 Sep
  论文阅读：Control Theoretic Approach to Fine-Tuning and Transfer Learning
- 22 Sep
  torchinfo 库可视化网络架构
- 22 Sep
  PyTorch 网络结构基础
- 22 Sep
  Peft 获取原模型 get_base_model 的 Bug
- 19 Sep
  约束问题的 Primal-Dual 算法
- 18 Sep
  Approximate KL Divergence using Fisher Information Matrix
- 17 Sep
  线性时不变系统的能控性 Controllable
- 15 Sep
  Pytorch-Lightning + Peft 实现 LoRA 微调示例
- 15 Sep
  论文阅读：Parameter-Efficient Fine-Tuning with Controls
- 13 Sep
  Pytorch 中的 Dataset、DataLoader
- 13 Sep
  论文阅读-Benchmarking Optimizers for Large Language Model Pretraining
- 11 Sep
  Pytest 中的 Fixture
- 11 Sep
  Pytest + VSCode 快速上手
- 10 Sep
  论文阅读：RL’s Razor Why Online Reinforcement Learning Forgets Less
- 07 Sep
  Pytorch Tensor 形状操作总结
- 07 Sep
  Pytorch 求导操作总结
- 06 Sep
  论文阅读：The Super Weight in Large Language Models
- 05 Sep
  Pytorch Tensor 数学操作总结
- 04 Sep
  拉格朗日乘子法
- 01 Sep
  Fisher 矩阵与弹性权重巩固 Elastic Weight Consolidation, EWC
- 01 Sep
  先验、后验概率、贝叶斯公式
- 30 Aug
  Method of Successive Approximations 通用格式
- 28 Aug
  论文阅读-Recall and Learn Fine Tuning with Less Forgetting
- 27 Aug
  AdamW: Adam with Decoupled Weight Decay
- 25 Aug
  Adam: Adaptive Moment Estimation
- 22 Aug
  论文阅读：Method of Successive Approximations
- 21 Aug
  KL 散度、交叉熵与对数似然
- 19 Aug
  Mutagen：好用的端口转发与远程文件同步工具
- 19 Aug
  Transformers 库 CLM 预训练与微调代码阅读
- 18 Aug
  LoRA (Low-Rank Adaptation)
- 18 Aug
  LaSalle’s Invariance Principle
- 16 Aug
  Hugging Face trl 微调库 SFT 代码阅读
- 16 Aug
  Heavy-ball 与 Momentum 算法等价性
- 16 Aug
  动力系统稳定性概览
- 15 Aug
  最优控制 Optimal Control 概览
- 15 Aug
  论文阅读：连续学习的最优控制方式
- 13 Aug
  Transformers 库 Trainer 使用与自定义优化器
- 12 Aug
  Transformers 库图像分类微调代码阅读
- 09 Aug
  Anaconda 全家桶介绍
- 08 Aug
  Pytorch Parameters 结构与 Muon 的调用
- 29 Jul
  MAE 测试环境搭建

Archive

2025