现在位置: 首页 > AI 入门教程 > 正文

AI 入门教程

AI(Artificial Intelligence,人工智能)是一种让计算机具备理解、学习、推理、生成内容以及执行任务能力的技术。

AI(Artificial Intelligence,人工智能)不再是固定程序的机械运行,而是可以通过数据学习、自主判断、适配不同场景的智能技术。

过去的软件依赖固定规则运行,而 AI 更像一种能够从数据中学习规律,并自主完成目标的新型计算方式。

今天的 AI 已经不只是聊天机器人,它已经能够:写文章、写代码、生成图片、分析数据、制作 PPT等。


谁适合阅读本教程?

  • 从未接触过 AI 的新人
  • 想提升工作效率的人
  • 想进入 AI 行业的人
  • 希望理解 ChatGPT、大模型、Agent 等概念的人
  • 程序员、设计师、运营、学生以及普通办公人群

不要求数学基础,也不要求会编程。


AI 能干嘛?

AI(Artificial Intelligence,人工智能)本质上是在模拟人的部分智能能力。

  • 感知信息:看懂文字、图片、语音、视频等各类数据
  • 理解语义:读懂人类自然语言、需求、场景和隐含逻辑
  • 自主学习:通过海量数据训练,持续优化能力,越用越精准
  • 推理决策:根据现有信息分析、判断、给出最优方案
  • 落地执行:辅助或自主完成创作、办公、分析、开发等各类任务
    通俗类比理解:
  • 传统软件 = 计算器:只能按固定规则计算,不会变通、不会思考
  • AI = 聪明的实习生:可以学习新知识、理解需求、自主干活、不断进步

这些原本属于人的能力,现在开始被计算机具备。


AI 核心基础原

  • 数据(基础):AI 的知识储备,海量文本、图片、视频、行为数据,是 AI 学习的原材料
  • 算法(规则):AI 的"学习方法",是让机器从数据中总结规律、提炼逻辑的数学规则
  • 模型(载体):训练完成后的成品,是可以直接使用的智能主体(如 GPT-4、Claude 3、通义千问)
  • 推理(能力):模型上线后,接收用户指令,结合所学知识输出结果、完成任务的过程

AI 类别

根据功能和场景,AI 主要分为 5 大类,覆盖 99% 的普通人使用场景:

根据功能和应用场景,AI 主要可以分为 5 大类,基本覆盖了 99% 普通人的使用需求:

AI 类型 核心能力 典型场景 代表工具
语言 AI(NLP)
最常用
理解、生成和处理文字语言内容 智能对话
文案创作
论文改写
代码编写
翻译
总结复盘
问答咨询
办公文案处理
ChatGPT
Claude
Qwen
豆包
视觉 AI(CV) 理解图片和视频内容,进行视觉分析与生成 人脸识别
图片修图
AI 绘图
视频剪辑
画面识别
工业瑕疵检测
证件照生成
Midjourney
Stable Diffusion
美图 AI
剪映 AI
语音 AI 实现语音与文字之间转换和交互 语音转文字
实时字幕
智能配音
语音翻译
智能音箱交互
讯飞听见
剪映字幕
手机语音助手
多模态 AI
主流趋势
同时支持文字、图片、语音、视频等多种输入输出 图片提问
图文创作
视频理解
多格式内容生成
综合问题解答
GPT-4V
豆包
通义千问
秒哒
自动化 AI(AI Agent) 自动执行任务,连接工具完成目标 文件整理
数据分析
PPT 自动生成
报表统计
批量处理文件
工作流自动化
QoderWork
搭子
n8n