机器学习核心方法

监督学习(Supervised Learning)

监督学习是指利用含标签的训练数据(输入与对应输出)训练模型，使模型学习输入到输出的映射关系，从而对新数据进行预测。其典型任务包括分类(输出离散标签)和回归(输出连续数值)，常用算法有线性回归、逻辑回归、决策树、支持向量机、神经网络等。监督学习在图像识别、垃圾邮件过滤、房价预测等场景应用广泛。

无监督学习(Unsupervised Learning)

无监督学习是指利用无标签的训练数据，通过挖掘数据内在结构或规律实现聚类、降维等任务。其核心是发现数据中隐藏的模式，无需人工标注目标。典型算法包括K-均值聚类、层次聚类、主成分分析(PCA)、自编码器等，在客户分群、异常检测、特征学习等领域发挥重要作用。

半监督学习（Semi-Supervised Learning）

半监督学习结合少量有标签数据和大量无标签数据进行训练，适用于标签获取成本高的场景(如医疗影像标注)。其核心思想是利用无标签数据的分布信息辅助模型学习,常见方法包括自训练(用模型预测无标签数据并作为伪标签)、十协同训练(多模型交互学习)等，在文本分类、语音识别等领域可有效提升模型性能。

强化学习（Reinforcement Learning，RL）

强化学习是研究智能体(Agent)如何通过与环境交互获取奖励，从而学习最优行为策略的方法。其核心要素包括状态(环境信息)、动作(智能体行为)、奖励(环境反馈)、策略(状态到动作的映射)。各智能体通过“试错”不断调整策略，以最大化长期累积奖励，在游戏AI、机器人控制、自动驾驶等领域取得突破性成果(如 AlphaGo)。

分类(Classification)

分类是监督学习的核心任务，目标是将输入数据划分到预定义的类别中。根据类别数量可分为二分类(如垃圾邮件识别)和多分类(如手写数字识别)，常用算法包括逻辑回归、支持向量机、决策树、随机森林、神经网络等。分类性能通常通过准确率、精确率、召回率、F1分数等指标评估。

回归(Regression)

回归是监督学习的另一核心任务，目标是预测连续数值输出(如房价、温度、销售额)。其核心是拟合输入与输出之间的函数关系，常用算法包括线性回归、多项式回归、岭回归、Lasso 回归、神经网络等。回归模型的性能通常通过均方误差(MSE)、平均绝对误差(MAE)等指标衡量。

聚类 (Clustering)

聚类是无监督学习的核心任务，目标是将相似数据样本归为同一簇，不同簇的数据样本差异较大。其核心是定义数据间的相似度度量(如欧氏距离、余弦相似度)，常用算法包括K-均值聚类(K-Means)、层次聚类(Hierarchical Clustering)、密度聚类(DBSCAN)等，在客户分群、异常检测、图像分割等领域应用广泛。

降维(Dimensionality Reduction)

降维是指将高维数据映射到低维空间，在保留关键信息的同时减少数据维度，以降低计算复杂度、缓解“维度灾难”。常用方法包括主成分分析(PCA，线性降维)、t-分布邻域嵌入(t-SNE，非线性降维)、自编码器(深度学习降维)等，在数据可视化、特征预处理、模式识别等场景发挥重要作用。

过拟合(Overfitting)

过拟合指模型在训练数据上表现优异，但在新数据(测试数据)上性能显著下降的现象，因模型过度学习训练数据中的噪声而非普遍规律所致。解决方法包括增加训练数据、简化模型(减少参数)、正则化(L1/L2 正则)、Dropout、早停等，是机器学习模型泛化能力优化的核心问题。

欠拟合 (Underfitting)

欠拟合指模型无法捕捉训练数据中的基本规律，在训练数据和测试数据上表现均较差的现象,通常因模型过于简单或训练不足所致。解决方法包括增加模型复杂度(如加深神经网络层数)、增加特征维度、延长训练时间等，与过拟合共同构成模型优化的两大挑战。

人工智能核心术语-机器学习核心方法