Deep Learning⚓︎

约 1086 个字预计阅读时间 5 分钟

核心知识

机器学习的基本概念
图像分类，尤其是线性分类器的原理（损失函数：Softmax）
基本的神经网络：激活函数
卷积神经网络（CNN）：卷积 + 池化
各种训练技术：
- 反向传播
- 随机梯度下降
- 选取超参数：数据分割
- 阻止过拟合：
  - 正则化
  - Dropout
  - 数据增强
- 批归一化
明确不考的：最后「网络架构」一节，并且不用记公式，重在理解概念
- 唯一要记的公式是神经网络的公式：
  
  \[ f = \sigma(W_3 \textcolor{yellowgreen}{\sigma(W_2} \textcolor{cornflowerblue}{\sigma(W_1 x + b)} \textcolor{yellowgreen}{+ b_2)} + b_3) \]

说明

一开始笔者想的是用 CS231n 来替代课内只用一节课介绍的内容。但到了期末发现这样做不太方便复习，于是笔者决定还是乖乖根据第 9 讲的课件做一下笔记吧。读者可将这份笔记看作期末复习特供版，所以建议在为 ZJU《计算机视觉导论》课程备考时阅读，平时学习的话还是阅读本笔记之后的笔记。

整理的时候发现很多内容还是笔者已有的笔记更完整些，所以笔者就贴上这些内容的链接，不另外撰写了。

Machine Learning⚓︎

机器学习中的重要概念：

模型(model)：解释输入 \(x\) 和输出 \(y\) 之间关系的数学描述
- 模型被定义为一个函数 \(y = f_w(x)\)，其参数记作 \(w\)
- 问题类型：
  - 回归(regression)：\(y\) 为实数
  - 分类(classification)：\(y\) 为离散标签
监督学习(supervised learning)：从标注数据中寻找 \(f_w\)
- 标注数据(labeled data)：现存的 \((x, y)\) 对，又称为训练数据(training data)
两个阶段：
- 训练(training)：对于给定的标注数据，寻找 \(f_w\)（模型拟合(model fitting)）
- 测试(testing)：对于给定的 \(f_w\) 和新的 \(x\)，寻找 \(y\)（又称为推理(inference)）

机器学习的一般流程如下：

最简单的回归形式是线性回归(linear regression)。

具体内容见笔记「使用线性分类器的图像分类」开头部分（到「k 最近邻分类器」一节之前）。

具体内容见笔记「使用线性分类器的图像分类」中「线性分类器」（到「多类 SVM（支持向量机）损失」之前的部分）。

具体内容见笔记「神经网络和反向传播」中「神经网络」一节（到「实现」小节之前 +「和生物神经网络比较」小节）。

具体内容见笔记「采用 CNNs 进行图像分类」中「归一化」之前的部分，以及笔记「CNN 架构」的 AlexNet 和 VGGNet 部分。

具体内容见笔记：

如何选取超参数：

如何阻止过拟合：

深度学习框架支持深度学习算法的快速开发，比如 Caffe、TensorFlow、PyTorch 等。它们往往提供了

评论区

如果大家有什么问题或想法，欢迎在下方留言~