机器学习介绍

机器学习介绍
可爱可倾机器学习介绍
1 机器学习的定义
机器学习是人工智能的一个子领域,研究如何让计算机系统利用数据和经验,来不断改善和优化自身的性能。 其核心思想是通过算法和模型让计算机从数据中学习,而不是通过明确的编程规则来执行任务。
2 机器学习的分类
机器学习的主要分支有监督学习、无监督学习、半监督学习、强化学习、深度学习等。
- 根据学习方式:
- 监督学习(Supervised Learning)
- 无监督学习(Unsupervised Learning)
- 半监督学习(Semi-supervised Learning)
- 强化学习(Reinforcement Learning)
- 根据学习任务:
- 分类(Classification)
- 回归(Regression)
- 聚类(Clustering)
- 降维(Dimensionality Reduction)
它们之间的关系如图所示:
graph LR
A[机器学习] --> B[监督学习]
A --> C[无监督学习]
B --> D[半监督学习]
C --> D[半监督学习]
A --> E[强化学习]
A --> F[深度学习]
A --> G[迁移学习]
E --> H[深度强化学习]
F --> H
机器学习分类
2.1 监督学习(Supervised Learning)
在监督学习中,模型通过使用带标签的训练数据进行学习,即每个输入数据都有一个对应的输出标签。目标是学习从输入到输出的映射关系,能够对新数据进行预测。
- 主要类别/任务:
- 分类(Classification): 将输入数据分类到预定义的类别中。
- 回归(Regression): 预测连续的数值。
- 主要算法
- 逻辑回归(Logistic Regression)
- 线性回归(Linear Regression)
- 支持向量机(Support Vector Machine, SVM)
- 决策树(Decision Tree)
- 随机森林(Random Forest)
- 深度神经网络(Deep Neural Networks, DNN)
2.2 无监督学习(Unsupervised Learning)
在无监督学习中,模型使用未标记的数据进行学习,试图从数据中发现隐藏的结构或模式。无监督学习不依赖于输出标签。
- 主要类别/任务:
- 聚类(Clustering): 将数据分组到不同的类别中,使得同一类别内的数据相似度较高,不同类别之间的数据相似度较低。
- 降维(Dimensionality Reduction): 减少数据的特征数量,同时尽可能保留重要信息。
- 主要算法
- K均值聚类(K-means Clustering)
- 层次聚类(Hierarchical Clustering)
- 主成分分析(Principal Component Analysis, PCA)
- 独立成分分析(Independent Component Analysis, ICA)
- t-分布邻域嵌入(t-Distributed Stochastic Neighbor Embedding, t-SNE)
- 自编码器(Autoencoder)
- 生成对抗网络(Generative Adversarial Networks, GAN)
2.3 半监督学习(Semi-supervised Learning)
半监督学习结合了监督学习和无监督学习的特点,使用少量标记数据和大量未标记数据进行训练。这种方法在标记数据难以获取但未标记数据丰富的情况下非常有用。
- 图半监督学习(Graph-based Semi-supervised Learning)
- 半监督支持向量机(Semi-supervised Support Vector Machine)
- 半监督深度学习(Semi-supervised Deep Learning)
2.4 强化学习(Reinforcement Learning)
通过智能体/机器人/代理(Agent)与环境(Environment)进行交互学习的方法。在强化学习中,代理根据环境的状态(State)选择动作(Action),并通过观察环境的反馈(奖励(Reward)或惩罚)来调整自己的行为策略,以达到最大化长期累积奖励的目标。
- 主要类别/任务:
- 基于值函数的强化学习(Value-based Reinforcement Learning): 通过学习值函数(Value Function)来指导代理的决策,以获得最大的长期累积奖励。
- 基于策略的强化学习(Policy-based Reinforcement Learning): 直接学习最优策略(Policy),以获得最大的长期累积奖励。
- 基于模型的强化学习(Model-based Reinforcement Learning): 通过学习环境的模型来指导代理的决策,以获得最大的长期累积奖励。
- 主要算法
- Q学习(Q-Learning)
- 深度Q网络(Deep Q-Network, DQN)
- 深度确定性策略梯度(Deep Deterministic Policy Gradient, DDPG)
- 近端策略优化(Proximal Policy Optimization, PPO)
2.5 深度学习(Deep Learning)
使用人工神经网络模型来学习数据的表征。与传统机器学习算法相比,深度学习模型可以自动地从数据中学习更加复杂、高阶的特征表示,因此在处理大规模、高维度数据时具有很强的表达能力。
- 主要类别/任务:
- 图像识别(Image Recognition)
- 语音识别(Speech Recognition)
- 自然语言处理(Natural Language Processing, NLP)
- 主要算法
- 卷积神经网络(Convolutional Neural Networks, CNN)
- 循环神经网络(Recurrent Neural Networks, RNN)
- 长短时记忆网络(Long Short-Term Memory, LSTM)
- 生成对抗网络(Generative Adversarial Networks, GAN)
2.6 深度强化学习(Deep Reinforcement Learning)
将深度学习和强化学习结合起来,使用深度神经网络模型来学习代理的策略或值函数,以获得最大的长期累积奖励。
- 主要类别/任务:
- 游戏玩法(Game Playing)
- 机器人控制(Robot Control)
- 自动驾驶(Autonomous Driving)
- 主要算法
- 深度Q网络(Deep Q-Network, DQN)
- 深度确定性策略梯度(Deep Deterministic Policy Gradient, DDPG)
- 近端策略优化(Proximal Policy Optimization, PPO)
2.7 迁移学习(Transfer Learning)
利用一个任务的学习经验来加速另一个相关任务学习的方法。在迁移学习中,模型通过学习一个任务的特征表示,可以更快地适应新的任务,特别是当新任务的数据较少或者新任务与原任务有一定的相关性时。
- 微调(Fine-tuning): 在预训练模型的基础上,使用新任务的数据进行微调,以适应新任务。
- 特征提取(Feature Extraction): 使用预训练模型提取特征,然后在新任务上训练一个简单的分类器。
- 领域适应(Domain Adaptation): 在源领域和目标领域之间进行迁移,以提高模型在目标领域的性能。
评论
匿名评论隐私政策
TwikooGiscus
✅ 若未加载出评论区,请刷新页面~






