知识小组同库第 5 篇
深度学习引言
发布 2025/03/10 14:36更新 2025/03/10 14:361157 字7 阅读
什么是神经网络?(What is a Neural Network)
1. 神经网络的本质:函数拟合
神经网络的核心任务是逼近一个未知的映射函数 f:x→y,而这个映射是基于大量数据样本学习得到的。因为现实中的很多问题,比如图像识别、自然语言处理、语音识别等,都可以抽象成一个从输入 x 到输出 y 的映射关系。
- 训练过程中,神经网络通过梯度下降优化其参数,使得其预测值 f(x) 尽可能接近真实值 y。
- 训练完成后,神经网络会找到一个近似的函数,能将新的 x 映射到 y。
2. 神经网络“在猜”吗?
“猜测”这个词可以描述神经网络的推理过程,但它并不是随机猜测,而是基于统计学习和优化算法进行的系统性预测:
- 随机初始化:网络的初始参数是随机的,因此刚开始的预测可能接近随机猜测。
- 训练学习:随着大量样本的训练,神经网络的权重会不断调整,使得它能够更准确地映射 x→y。
- 泛化能力:训练好的神经网络在看不见的新数据时,不是凭空猜测,而是利用已学习的模式进行预测。
3. 神经网络和传统拟合方法的区别
神经网络与传统的函数拟合方法(如线性回归、多项式回归)不同的地方在于:
- 它不需要事先设定明确的函数形式(如 y=ax+b)。
- 通过非线性激活函数和多层神经元,它可以拟合非常复杂的关系。
- 对高维度数据(如图像、文本)也能有效处理。
神经网络的监督学习(Supervised Learning with Neural Networks)
1. 什么是监督学习 (Supervised Learning)?
监督学习是机器学习的一种类型,指使用一组带有明确标签的数据集,通过训练一个模型,从而预测新数据的输出。具体来说:
- 输入 (x):数据的特征,比如房屋面积、卧室数量等。
- 输出 (y):数据对应的标签,比如房价。
例如:
- 房价预测:输入房屋特征,预测房价。
- 广告点击预测:输入用户及广告信息,预测用户是否会点击广告。
2. 常见神经网络类型
根据输入数据类型的不同,常见的神经网络类型有:
数据类型 | 推荐的神经网络类型 | 特点 |
结构化数据 | 标准全连接神经网络 (Fully Connected Network, FCN) | 最基础,广泛用于房地产预测、广告预测 |
图像数据 | 卷积神经网络 (CNN, Convolutional Neural Network) | 擅长图像识别、图像分类、目标检测 |
序列数据(文本、语音) | 递归神经网络 (RNN, Recurrent Neural Network) | 适用于语音识别、自然语言处理、时间序列预测 |
- CNN:尤其擅长从图像中提取空间特征。
- RNN:尤其擅长处理具有时间或序列结构的数据(如音频、文本)。
3. 结构化数据与非结构化数据的区别
类型 | 定义 | 示例 | 难度 |
结构化数据 | 数据特征清晰定义,有固定格式和列名 | 房屋特征(面积、卧室数)、用户信息(年龄) | 较简单 |
非结构化数据 | 数据无固定结构,特征不明确,需要复杂处理 | 图像像素、音频波形、自然文本 | 较困难 |
- 传统机器学习更易处理结构化数据;
- 深度学习擅长处理非结构化数据,这是近年深度学习兴起的重要原因之一。
为什么神经网络会流行?(Why is Deep Learning taking off?)
- 数据规模的爆炸式增长,提供了训练深度神经网络所需的“燃料”;
- 硬件计算能力的飞跃式提升,使得大规模神经网络的训练变得切实可行;
- 算法和网络结构的不断创新与优化,显著提高了训练效率与模型表现,拓展了深度学习的应用领域。
上一篇
神经网络的编程基础
更新 2025/03/11 07:38