摘要:但是事实上,AI这个概念在上世纪五十年代就已经出现。今天简单按时间顺序整理一下AI相关的名词。
可以处理原始的非结构性数据
CNN,Convolutional Neural Network,卷积神经网络。
chatGPT爆火以来,AI如火如荼地开始出现在普通人的视野中。但是事实上,AI这个概念在上世纪五十年代就已经出现。今天简单按时间顺序整理一下AI相关的名词。
AI,Artificial Intelligence,人工智能。是一切的开端。
目标:让机器像人感知、学习、推理、决策甚至创造
范畴较大,下棋机器人,自动驾驶到简单的一个温控模块,都可以属于“智能”的范畴
ML,Machine Learning,机器学习。最早的AI领域。
核心:寻找一个函数 f,使得 y = f(x),其中 x是输入数据,y是期望的输出。ML从历史数据中自动学习出这个 f。
f
y = f(x)
x
y
应用:垃圾邮件过滤、股票金融数据分析。善于处理结构化数据
DL,Deep Learning,深度学习。机器学习发展的一个分支。
定义:模型受生物神经网络启发,由多层的“神经元”(节点)相互连接而成。“深度”指的是网络的层次非常多。
核心:通过多层非线性处理单元(层)进行特征提取与转换,低层识别简单特征(如图像的边缘),高层组合低层特征形成更抽象的概念(如眼睛、车轮)
进步性:传统ML需要人工设计“特征工程”(如告诉计算机什么是“纹理”“棱角”),而DL是直接把原始数据(像素)输入,它自己能像小孩认识世界一样,从简单到复杂,一层层自动构建出对事物的理解
应用:图像分类、文本分析、AlphaGo。可以处理原始的非结构性数据
CNN,Convolutional Neural Network,卷积神经网络。深度学习早期处理空间数据的经典网络架构
定义:专门为处理具有网格状拓扑结构数据(如图像)而设计的深度学习网络。
核心:通过“卷积核”在输入数据上滑动,提取局部特征(如边缘),并通过“池化”层逐步降低数据空间尺寸,实现平移不变性(无论物体在图片哪个位置都能识别)。
应用:人脸识别、医学影像分析、自动驾驶中的物体检测。
RNN,Recurrent Neural Network,循环神经网络。深度学习早期处理序列数据的经典网络架构
定义:为处理序列数据(如时间序列、语句)而设计的神经网络,其单元间存在循环,允许信息持久化。
核心:网络中存在“记忆”机制,当前时刻的输出依赖于当前输入和前一时刻的隐藏状态,使其理论上能处理任意长度的序列并捕捉前后依赖
应用:股票价格预测、早期语音识别、生成文本摘要
LM,Language Model,语言模型。智能的初见端倪。
LLM,Large Language Model,大语言模型。妙就妙在一个“大”上,量变引发质变。通向通用智能的关键一跃。
定义:基于海量文本数据和巨大参数量(通常数十亿到万亿级)训练而成的语言模型。其核心架构是 Transformer。
核心:LLM的飞跃源于 Scaling Law:当模型参数、训练数据和计算力超过某个临界规模后,会“涌现”出在小模型中不具备的复杂能力(如推理、代码生成、指令遵循)。
进步性:传统LM像一个精通语法的学生,能写出句子通顺的作文。LLM则像一位博览群书、融会贯通的学者,不仅能写,还能根据你提出的要求(指令),模仿特定风格创作、总结文献、解答专业问题甚至进行逻辑辩论。
跨时代意义:LLM,特别是基于Transformer的生成式模型,是当前AI发展的奇点。它正在成为新的“操作系统”或“基础平台”,几乎所有行业都在其上构建应用。
应用:大家熟知的ChatGPT/DeepSeek/豆包等AI对话助手、GitHub Copilot代码补全与生成、AI辅助写作和翻译。
AIGC,AI Generate Contents,人工智能生成内容。当下AI技术浪潮的最大化应用。
定义:利用人工智能技术,自动生成文本、图像、音频、视频、代码等多种形式数字内容的技术集合与产业范畴。
核心:是一个应用生态,其核心技术底座是生成式模型,特别是经过海量多模态数据训练的大模型。它通过理解人类指令(提示词),学习数据中的内在模式和分布,从而创造出符合要求的新内容。
应用:chatGPT、豆包、元宝等AI助手;NanoBanana等图像生成助手;Sora等音频助手;以及各行各业如雨后春笋般出现的AI App。
划时代意义:新型数字生产要素,AIGC产出的内容本身将成为训练下一代模型的数据燃料,形成数据飞轮。同时降低创作门槛,激发全民创造力。专业工具(如Photoshop、Premiere)需要长期训练,而AIGC工具让任何人用自然语言描述即可成为“创作者”。
AGI,Artificial General Intelligence,通用人工智能。人类AI发展的北极星。
定义:指具备与人类相当、甚至超越人类的综合认知能力的AI系统。它能够在任何智力任务上,像人类一样学习、理解、规划和创新,而非局限于特定领域。
核心:核心特征是自主性、通用性 和举一反三的能力。它拥有对世界的深刻理解(物理常识、社会常识、情感等),并能将在一个领域学到的技能和知识,迁移到另一个看似不相关的领域去解决新问题。
AGI是驱动整个AI领域从ML、DL、LM、LLM一路发展而来的终极愿景,是所有AI长期研究的核心动力。
可以处理原始的非结构性数据
CNN,Convolutional Neural Network,卷积神经网络。
chatGPT爆火以来,AI如火如荼地开始出现在普通人的视野中。但是事实上,AI这个概念在上世纪五十年代就已经出现。今天简单按时间顺序整理一下AI相关的名词。
AI,Artificial Intelligence,人工智能。是一切的开端。
目标:让机器像人感知、学习、推理、决策甚至创造
范畴较大,下棋机器人,自动驾驶到简单的一个温控模块,都可以属于“智能”的范畴
ML,Machine Learning,机器学习。最早的AI领域。
核心:寻找一个函数
f,使得y = f(x),其中x是输入数据,y是期望的输出。ML从历史数据中自动学习出这个f。应用:垃圾邮件过滤、股票金融数据分析。善于处理结构化数据
DL,Deep Learning,深度学习。机器学习发展的一个分支。
定义:模型受生物神经网络启发,由多层的“神经元”(节点)相互连接而成。“深度”指的是网络的层次非常多。
核心:通过多层非线性处理单元(层)进行特征提取与转换,低层识别简单特征(如图像的边缘),高层组合低层特征形成更抽象的概念(如眼睛、车轮)
进步性:传统ML需要人工设计“特征工程”(如告诉计算机什么是“纹理”“棱角”),而DL是直接把原始数据(像素)输入,它自己能像小孩认识世界一样,从简单到复杂,一层层自动构建出对事物的理解
应用:图像分类、文本分析、AlphaGo。可以处理原始的非结构性数据
CNN,Convolutional Neural Network,卷积神经网络。深度学习早期处理空间数据的经典网络架构
定义:专门为处理具有网格状拓扑结构数据(如图像)而设计的深度学习网络。
核心:通过“卷积核”在输入数据上滑动,提取局部特征(如边缘),并通过“池化”层逐步降低数据空间尺寸,实现平移不变性(无论物体在图片哪个位置都能识别)。
应用:人脸识别、医学影像分析、自动驾驶中的物体检测。
RNN,Recurrent Neural Network,循环神经网络。深度学习早期处理序列数据的经典网络架构
定义:为处理序列数据(如时间序列、语句)而设计的神经网络,其单元间存在循环,允许信息持久化。
核心:网络中存在“记忆”机制,当前时刻的输出依赖于当前输入和前一时刻的隐藏状态,使其理论上能处理任意长度的序列并捕捉前后依赖
应用:股票价格预测、早期语音识别、生成文本摘要
LM,Language Model,语言模型。智能的初见端倪。
LLM,Large Language Model,大语言模型。妙就妙在一个“大”上,量变引发质变。通向通用智能的关键一跃。
定义:基于海量文本数据和巨大参数量(通常数十亿到万亿级)训练而成的语言模型。其核心架构是 Transformer。
核心:LLM的飞跃源于 Scaling Law:当模型参数、训练数据和计算力超过某个临界规模后,会“涌现”出在小模型中不具备的复杂能力(如推理、代码生成、指令遵循)。
进步性:传统LM像一个精通语法的学生,能写出句子通顺的作文。LLM则像一位博览群书、融会贯通的学者,不仅能写,还能根据你提出的要求(指令),模仿特定风格创作、总结文献、解答专业问题甚至进行逻辑辩论。
跨时代意义:LLM,特别是基于Transformer的生成式模型,是当前AI发展的奇点。它正在成为新的“操作系统”或“基础平台”,几乎所有行业都在其上构建应用。
应用:大家熟知的ChatGPT/DeepSeek/豆包等AI对话助手、GitHub Copilot代码补全与生成、AI辅助写作和翻译。
AIGC,AI Generate Contents,人工智能生成内容。当下AI技术浪潮的最大化应用。
定义:利用人工智能技术,自动生成文本、图像、音频、视频、代码等多种形式数字内容的技术集合与产业范畴。
核心:是一个应用生态,其核心技术底座是生成式模型,特别是经过海量多模态数据训练的大模型。它通过理解人类指令(提示词),学习数据中的内在模式和分布,从而创造出符合要求的新内容。
应用:chatGPT、豆包、元宝等AI助手;NanoBanana等图像生成助手;Sora等音频助手;以及各行各业如雨后春笋般出现的AI App。
划时代意义:新型数字生产要素,AIGC产出的内容本身将成为训练下一代模型的数据燃料,形成数据飞轮。同时降低创作门槛,激发全民创造力。专业工具(如Photoshop、Premiere)需要长期训练,而AIGC工具让任何人用自然语言描述即可成为“创作者”。
AGI,Artificial General Intelligence,通用人工智能。人类AI发展的北极星。
定义:指具备与人类相当、甚至超越人类的综合认知能力的AI系统。它能够在任何智力任务上,像人类一样学习、理解、规划和创新,而非局限于特定领域。
核心:核心特征是自主性、通用性 和举一反三的能力。它拥有对世界的深刻理解(物理常识、社会常识、情感等),并能将在一个领域学到的技能和知识,迁移到另一个看似不相关的领域去解决新问题。
AGI是驱动整个AI领域从ML、DL、LM、LLM一路发展而来的终极愿景,是所有AI长期研究的核心动力。