用户工具

站点工具


ai:ai基础

**这是本文档旧的修订版!**

AI基础


生命周期

AI生命周期是规划、训练、部署和维护AI系统的迭代过程。

  1. 问题定义:确认要使用AI解决的具体问题
  2. 数据收集和准备:训练数据的质量和数量是影响 AI 模型性能的最重要因素
  3. 模型选择:选择最适合当前需求、训练数据和计算资源的模型架构
  4. 模型训练:计算密集型过程,模型会分析庞大的数据集,以学习其中的模式和关系
  5. 模型评估:评估模型是否能很好泛化到未见过的数据
  6. 模型部署:在实际生产环境中运行模型
  7. 模型监控:持续监控模型性能指标和用户反馈

算法

AI算法主要按学习机制与功能用途分类。常见分类包括:监督学习(用于标记数据预测)、无监督学习(用于发现数据模式)、强化学习(通过奖惩机制学习决策)、深度学习(模拟人脑神经网络),以及近年来主流的生成式AI。

监督学习

监督学习 (Supervised Learning)利用已标注的“输入-输出”数据进行训练,让模型学会映射规律,常用于预测和分类任务。

  • 分类算法 (Classification):预测离散类别。
    • 代表算法:逻辑回归、支持向量机 (SVM)、决策树、随机森林。
    • 常见应用:垃圾邮件识别、疾病诊断。
  • 回归算法 (Regression):预测连续的数值。
    • 代表算法:线性回归、XGBoost、LightGBM。
    • 常见应用:房价预测、股票价格趋势分析。

无监督学习

无监督学习 (Unsupervised Learning)处理未标注的数据,通过寻找数据内部的隐藏结构和特征来进行分析。

  • 聚类算法 (Clustering),将相似的数据样本分到同一组。
    • 代表算法:K-Means、DBSCAN。
    • 常见应用:客户群体细分、图像分割。
  • 降维 (Dimensionality Reduction),在保留核心信息的前提下简化数据集。
    • 代表算法:主成分分析 (PCA)。
    • 常见应用:数据压缩、特征提取。

强化学习

强化学习 (Reinforcement Learning)算法通过与环境进行交互,不断试错,根据“奖励”或“惩罚”机制调整策略,以达到最大化长期收益的目标。

  • 代表算法:Q-Learning、深度强化学习 (DQN)、PPO。
  • 常见应用:AlphaGo下棋、机器人控制、自动驾驶。

深度学习

深度学习 (Deep Learning)基于人工神经网络架构,使用多层隐藏层处理海量数据,具备极强的特征提取能力。

  • 代表算法:卷积神经网络 (CNN)、循环神经网络 (RNN/LSTM)。
  • 常见应用:人脸识别、语音识别、机器翻译。

生成式AI

生成式AI (Generative AI)能够通过学习已有数据的分布特征,创造出全新的、原创的内容(如文本、图像、音频等)。

  • 代表算法:Transformer架构、生成对抗网络 (GAN)、扩散模型 (Diffusion)。
  • 常见应用:大语言模型(如ChatGPT)、AI绘画(如Midjourney)。

硬件

AI 训练和推理是一个高度计算密集型的流程,需要专门的硬件和软件。

  • 图形处理单元 (GPU)
  • 张量处理单元 (TPU)
  • 神经处理单元 (NPU)
  • 现场可编程门阵列
  • 专用集成电路
/app/www/public/data/attic/ai/ai基础.1779901113.txt.gz · 最后更改: xing