ai:ai基础
**这是本文档旧的修订版!**
目录
AI基础
生命周期
AI生命周期是规划、训练、部署和维护 AI 系统的迭代过程。
- 问题定义:确认要使用AI解决的具体问题
- 数据收集和准备:训练数据的质量和数量是影响 AI 模型性能的最重要因素
- 模型选择:选择最适合当前需求、训练数据和计算资源的模型架构
- 模型训练:计算密集型过程,模型会分析庞大的数据集,以学习其中的模式和关系
- 模型评估:评估模型是否能很好泛化到未见过的数据
- 模型部署:在实际生产环境中运行模型
- 模型监控:持续监控模型性能指标和用户反馈
算法
- 监督学习(用于标记数据预测)
- 无监督学习(用于发现数据模式)
- 强化学习(通过奖惩机制学习决策)
- 深度学习(模拟人脑神经网络)
- 近年来主流的生成式AI
监督学习 (Supervised Learning)
利用已标注的“输入-输出”数据进行训练,让模型学会映射规律,常用于预测和分类任务。
- 分类算法 (Classification):预测离散类别。
- 代表算法:逻辑回归、支持向量机 (SVM)、决策树、随机森林。
- 常见应用:垃圾邮件识别、疾病诊断。
- 回归算法 (Regression):预测连续的数值。
- 代表算法:线性回归、XGBoost、LightGBM。
- 常见应用:房价预测、股票价格趋势分析。
无监督学习 (Unsupervised Learning)
处理未标注的数据,通过寻找数据内部的隐藏结构和特征来进行分析。
- 聚类算法 (Clustering),将相似的数据样本分到同一组。
- 代表算法:K-Means、DBSCAN。
- 常见应用:客户群体细分、图像分割。
- 降维 (Dimensionality Reduction),在保留核心信息的前提下简化数据集。
- 代表算法:主成分分析 (PCA)。
- 常见应用:数据压缩、特征提取。
强化学习 (Reinforcement Learning)算法
通过与环境进行交互,不断试错,根据“奖励”或“惩罚”机制调整策略,以达到最大化长期收益的目标。
- 代表算法:Q-Learning、深度强化学习 (DQN)、PPO。
- 常见应用:AlphaGo下棋、机器人控制、自动驾驶。
深度学习 (Deep Learning)
基于人工神经网络架构,使用多层隐藏层处理海量数据,具备极强的特征提取能力。
- 代表算法:卷积神经网络 (CNN)、循环神经网络 (RNN/LSTM)。
- 常见应用:人脸识别、语音识别、机器翻译。
生成式AI (Generative AI)能够通过学习已有数据的分布特征,创造出全新的、原创的内容(如文本、图像、音频等)。
- 代表算法:Transformer架构、生成对抗网络 (GAN)、扩散模型 (Diffusion)。
- 常见应用:大语言模型(如ChatGPT)、AI绘画(如Midjourney)。
硬件
AI 训练和推理是一个高度计算密集型的流程,需要专门的硬件和软件。
- 图形处理单元 (GPU)
- 张量处理单元 (TPU)
- 神经处理单元 (NPU)
- 现场可编程门阵列
- 专用集成电路
/app/www/public/data/attic/ai/ai基础.1779900326.txt.gz · 最后更改: 由 xing
