Skip to main content

Deep Learning

Foundations

  • MLP - 多层感知机: 线性变换、激活函数、损失函数、梯度下降、反向传播

Architectures

  • CNN - 卷积神经网络: 卷积、池化、全连接层、Spatial Transformer
  • RNN - 循环神经网络: 序列建模、LSTM
  • ResNet - 残差连接: 深度网络训练、梯度传播

Attention

  • Transformer - Self-Attention、Multi-Head Attention、Positional Encoding、KV Cache

Special Topics