AI 入门教程

AI(Artificial Intelligence,人工智能)是一种让计算机具备理解、学习、推理、生成内容以及执行任务能力的技术。
AI(Artificial Intelligence,人工智能)不再是固定程序的机械运行,而是可以通过数据学习、自主判断、适配不同场景的智能技术。
过去的软件依赖固定规则运行,而 AI 更像一种能够从数据中学习规律,并自主完成目标的新型计算方式。
今天的 AI 已经不只是聊天机器人,它已经能够:写文章、写代码、生成图片、分析数据、制作 PPT等。
谁适合阅读本教程?
- 从未接触过 AI 的新人
- 想提升工作效率的人
- 想进入 AI 行业的人
- 希望理解 ChatGPT、大模型、Agent 等概念的人
- 程序员、设计师、运营、学生以及普通办公人群
不要求数学基础,也不要求会编程。
AI 能干嘛?
AI(Artificial Intelligence,人工智能)本质上是在模拟人的部分智能能力。
- 感知信息:看懂文字、图片、语音、视频等各类数据
- 理解语义:读懂人类自然语言、需求、场景和隐含逻辑
- 自主学习:通过海量数据训练,持续优化能力,越用越精准
- 推理决策:根据现有信息分析、判断、给出最优方案
- 落地执行:辅助或自主完成创作、办公、分析、开发等各类任务
通俗类比理解: - 传统软件 = 计算器:只能按固定规则计算,不会变通、不会思考
- AI = 聪明的实习生:可以学习新知识、理解需求、自主干活、不断进步
这些原本属于人的能力,现在开始被计算机具备。
AI 核心基础原
- 数据(基础):AI 的知识储备,海量文本、图片、视频、行为数据,是 AI 学习的原材料
- 算法(规则):AI 的"学习方法",是让机器从数据中总结规律、提炼逻辑的数学规则
- 模型(载体):训练完成后的成品,是可以直接使用的智能主体(如 GPT-4、Claude 3、通义千问)
- 推理(能力):模型上线后,接收用户指令,结合所学知识输出结果、完成任务的过程
AI 类别
根据功能和场景,AI 主要分为 5 大类,覆盖 99% 的普通人使用场景:
根据功能和应用场景,AI 主要可以分为 5 大类,基本覆盖了 99% 普通人的使用需求:
| AI 类型 | 核心能力 | 典型场景 | 代表工具 |
|---|---|---|---|
|
语言 AI(NLP) 最常用 |
理解、生成和处理文字语言内容 |
智能对话 文案创作 论文改写 代码编写 翻译 总结复盘 问答咨询 办公文案处理 |
ChatGPT Claude Qwen 豆包 |
| 视觉 AI(CV) | 理解图片和视频内容,进行视觉分析与生成 |
人脸识别 图片修图 AI 绘图 视频剪辑 画面识别 工业瑕疵检测 证件照生成 |
Midjourney Stable Diffusion 美图 AI 剪映 AI |
| 语音 AI | 实现语音与文字之间转换和交互 |
语音转文字 实时字幕 智能配音 语音翻译 智能音箱交互 |
讯飞听见 剪映字幕 手机语音助手 |
|
多模态 AI 主流趋势 |
同时支持文字、图片、语音、视频等多种输入输出 |
图片提问 图文创作 视频理解 多格式内容生成 综合问题解答 |
GPT-4V 豆包 通义千问 秒哒 |
| 自动化 AI(AI Agent) | 自动执行任务,连接工具完成目标 |
文件整理 数据分析 PPT 自动生成 报表统计 批量处理文件 工作流自动化 |
QoderWork 搭子 n8n |
