ai:ai基础

这是本文档旧的修订版！

目录

生命周期
算法
硬件

AI基础

生命周期

AI生命周期是规划、训练、部署和维护 AI 系统的迭代过程。

问题定义：确认要使用AI解决的具体问题
数据收集和准备：训练数据的质量和数量是影响 AI 模型性能的最重要因素
模型选择：选择最适合当前需求、训练数据和计算资源的模型架构
模型训练：计算密集型过程，模型会分析庞大的数据集，以学习其中的模式和关系
模型评估：评估模型是否能很好泛化到未见过的数据
模型部署：在实际生产环境中运行模型
模型监控：持续监控模型性能指标和用户反馈

算法

监督学习（用于标记数据预测）
无监督学习（用于发现数据模式）
强化学习（通过奖惩机制学习决策）
深度学习（模拟人脑神经网络）
近年来主流的生成式AI

监督学习 (Supervised Learning)

利用已标注的“输入-输出”数据进行训练，让模型学会映射规律，常用于预测和分类任务。

分类算法 (Classification)：预测离散类别。
- 代表算法：逻辑回归、支持向量机 (SVM)、决策树、随机森林。
- 常见应用：垃圾邮件识别、疾病诊断。
回归算法 (Regression)：预测连续的数值。
- 代表算法：线性回归、XGBoost、LightGBM。
- 常见应用：房价预测、股票价格趋势分析。

无监督学习 (Unsupervised Learning)

处理未标注的数据，通过寻找数据内部的隐藏结构和特征来进行分析。

聚类算法 (Clustering)，将相似的数据样本分到同一组。
- 代表算法：K-Means、DBSCAN。
- 常见应用：客户群体细分、图像分割。
降维 (Dimensionality Reduction)，在保留核心信息的前提下简化数据集。
- 代表算法：主成分分析 (PCA)。
- 常见应用：数据压缩、特征提取。

强化学习 (Reinforcement Learning)算法

通过与环境进行交互，不断试错，根据“奖励”或“惩罚”机制调整策略，以达到最大化长期收益的目标。

代表算法：Q-Learning、深度强化学习 (DQN)、PPO。
常见应用：AlphaGo下棋、机器人控制、自动驾驶。

深度学习 (Deep Learning)

基于人工神经网络架构，使用多层隐藏层处理海量数据，具备极强的特征提取能力。

代表算法：卷积神经网络 (CNN)、循环神经网络 (RNN/LSTM)。
常见应用：人脸识别、语音识别、机器翻译。

生成式AI (Generative AI)能够通过学习已有数据的分布特征，创造出全新的、原创的内容（如文本、图像、音频等）。

代表算法：Transformer架构、生成对抗网络 (GAN)、扩散模型 (Diffusion)。
常见应用：大语言模型（如ChatGPT）、AI绘画（如Midjourney）。

硬件

AI 训练和推理是一个高度计算密集型的流程，需要专门的硬件和软件。

图形处理单元 (GPU)
张量处理单元 (TPU)
神经处理单元 (NPU)
现场可编程门阵列
专用集成电路

/app/www/public/data/attic/ai/ai基础.1779900326.txt.gz · 最后更改: 2026/05/27 22:45 由 xing