跳到主要内容
xray.top
知识小组同库第 5

深度学习引言

发布 2025/03/10 14:36更新 2025/03/10 14:3611577 阅读

什么是神经网络?(What is a Neural Network)

1. 神经网络的本质:函数拟合

神经网络的核心任务是逼近一个未知的映射函数 f:x→y,而这个映射是基于大量数据样本学习得到的。因为现实中的很多问题,比如图像识别、自然语言处理、语音识别等,都可以抽象成一个从输入 x 到输出 y 的映射关系。

  • 训练过程中,神经网络通过梯度下降优化其参数,使得其预测值 f(x) 尽可能接近真实值 y。
  • 训练完成后,神经网络会找到一个近似的函数,能将新的 x 映射到 y。

2. 神经网络“在猜”吗?

“猜测”这个词可以描述神经网络的推理过程,但它并不是随机猜测,而是基于统计学习和优化算法进行的系统性预测:

  • 随机初始化:网络的初始参数是随机的,因此刚开始的预测可能接近随机猜测。
  • 训练学习:随着大量样本的训练,神经网络的权重会不断调整,使得它能够更准确地映射 x→y。
  • 泛化能力:训练好的神经网络在看不见的新数据时,不是凭空猜测,而是利用已学习的模式进行预测。

3. 神经网络和传统拟合方法的区别

神经网络与传统的函数拟合方法(如线性回归、多项式回归)不同的地方在于:

  • 它不需要事先设定明确的函数形式(如 y=ax+b)。
  • 通过非线性激活函数多层神经元,它可以拟合非常复杂的关系。
  • 对高维度数据(如图像、文本)也能有效处理。

神经网络的监督学习(Supervised Learning with Neural Networks)

1. 什么是监督学习 (Supervised Learning)?

监督学习是机器学习的一种类型,指使用一组带有明确标签的数据集,通过训练一个模型,从而预测新数据的输出。具体来说:

  • 输入 (x):数据的特征,比如房屋面积、卧室数量等。
  • 输出 (y):数据对应的标签,比如房价。

例如:

  • 房价预测:输入房屋特征,预测房价。
  • 广告点击预测:输入用户及广告信息,预测用户是否会点击广告。

2. 常见神经网络类型

根据输入数据类型的不同,常见的神经网络类型有:

数据类型

推荐的神经网络类型

特点

结构化数据

标准全连接神经网络 (Fully Connected Network, FCN)

最基础,广泛用于房地产预测、广告预测

图像数据

卷积神经网络 (CNN, Convolutional Neural Network)

擅长图像识别、图像分类、目标检测

序列数据(文本、语音)

递归神经网络 (RNN, Recurrent Neural Network)

适用于语音识别、自然语言处理、时间序列预测

  • CNN:尤其擅长从图像中提取空间特征。
  • RNN:尤其擅长处理具有时间或序列结构的数据(如音频、文本)。

3. 结构化数据与非结构化数据的区别

类型

定义

示例

难度

结构化数据

数据特征清晰定义,有固定格式和列名

房屋特征(面积、卧室数)、用户信息(年龄)

较简单

非结构化数据

数据无固定结构,特征不明确,需要复杂处理

图像像素、音频波形、自然文本

较困难

  • 传统机器学习更易处理结构化数据;
  • 深度学习擅长处理非结构化数据,这是近年深度学习兴起的重要原因之一。

为什么神经网络会流行?(Why is Deep Learning taking off?)

  • 数据规模的爆炸式增长,提供了训练深度神经网络所需的“燃料”;
  • 硬件计算能力的飞跃式提升,使得大规模神经网络的训练变得切实可行;
  • 算法和网络结构的不断创新与优化,显著提高了训练效率与模型表现,拓展了深度学习的应用领域。
更新 2025/03/11 07:38