这是本文档旧的修订版！

AI基础

AI生命周期是规划、训练、部署和维护AI系统的迭代过程。

AI算法主要按学习机制与功能用途分类。常见分类包括：监督学习（用于标记数据预测）、无监督学习（用于发现数据模式）、强化学习（通过奖惩机制学习决策）、深度学习（模拟人脑神经网络），以及近年来主流的生成式AI。

监督学习 (Supervised Learning)利用已标注的“输入-输出”数据进行训练，让模型学会映射规律，常用于预测和分类任务。

分类算法 (Classification)：预测离散类别。
- 代表算法：逻辑回归、支持向量机 (SVM)、决策树、随机森林。
- 常见应用：垃圾邮件识别、疾病诊断。
回归算法 (Regression)：预测连续的数值。
- 代表算法：线性回归、XGBoost、LightGBM。
- 常见应用：房价预测、股票价格趋势分析。

无监督学习 (Unsupervised Learning)处理未标注的数据，通过寻找数据内部的隐藏结构和特征来进行分析。

聚类算法 (Clustering)，将相似的数据样本分到同一组。
- 代表算法：K-Means、DBSCAN。
- 常见应用：客户群体细分、图像分割。
降维 (Dimensionality Reduction)，在保留核心信息的前提下简化数据集。
- 代表算法：主成分分析 (PCA)。
- 常见应用：数据压缩、特征提取。

强化学习 (Reinforcement Learning)算法通过与环境进行交互，不断试错，根据“奖励”或“惩罚”机制调整策略，以达到最大化长期收益的目标。

深度学习 (Deep Learning)基于人工神经网络架构，使用多层隐藏层处理海量数据，具备极强的特征提取能力。

生成式AI (Generative AI)能够通过学习已有数据的分布特征，创造出全新的、原创的内容（如文本、图像、音频等）。

AI 训练和推理是一个高度计算密集型的流程，需要专门的硬件和软件。