机器学习基础术语
机器学习 (Machine Learning)
机器学习是人工智能的一个分支,它使计算机系统能够通过经验自动改进性能,而无需显式编程。ML算法通过分析数据来识别模式,并基于这些模式做出预测或决策。
示例:垃圾邮件过滤器通过学习大量邮件样本,自动识别并过滤垃圾邮件。
监督学习 (Supervised Learning)
监督学习是一种机器学习方法,其中算法从标记的训练数据中学习,每个训练样本都有一个对应的标签或目标值。算法学习输入到输出的映射关系。
示例:房价预测模型使用历史房屋数据(面积、位置等特征)和对应价格进行训练。
无监督学习 (Unsupervised Learning)
无监督学习处理未标记的数据,算法需要自行发现数据中的隐藏模式、结构或关系。常见任务包括聚类和降维。
示例:客户细分分析,将具有相似购买行为的客户自动分组。
强化学习 (Reinforcement Learning)
强化学习是智能体通过与环境交互,根据获得的奖励信号学习最优行为策略的机器学习方法。智能体需要在探索和利用之间找到平衡。
示例:AlphaGo通过自我对弈学习围棋策略,最终击败人类世界冠军。
算法优化与评估
梯度下降 (Gradient Descent)
梯度下降是优化机器学习模型的迭代算法,通过计算损失函数的梯度并沿负梯度方向更新参数,逐步最小化损失函数。
示例:训练神经网络时,每次迭代都小幅调整权重以减少预测误差。
过拟合 (Overfitting)
过拟合指模型在训练数据上表现优异,但在未见过的测试数据上表现较差的现象。模型过度学习了训练数据的噪声而非潜在规律。
示例:学生死记硬背考题答案,遇到新题型就无法正确解答。
交叉验证 (Cross-Validation)
交叉验证是评估模型泛化能力的统计方法,通过将数据分成多个子集,轮流使用不同子集进行训练和验证,获得更可靠的性能估计。
示例:K折交叉验证将数据分为K份,进行K次训练和验证,取平均性能作为最终评估。
准确率/召回率 (Precision/Recall)
准确率和召回率是分类模型的关键指标。准确率衡量预测为正例中实际为正例的比例,召回率衡量所有实际正例中被正确预测的比例。
示例:疾病筛查中,高召回率确保不漏诊,高准确率减少误诊带来的不必要恐慌。