咱们先从一个生活场景聊起:你小时候学认水果,妈妈拿出苹果、香蕉、橘子放在桌上,告诉你“红的、圆的、咬着脆甜的是苹果”“黄的、弯的、剥了皮吃的是香蕉”。你看了几次、摸了几次、吃了几次后,下次再见到超市里的苹果,不用妈妈说,自己就能认出来——这就是“学习”。
那AI的“深度学习”,其实跟人学认水果的逻辑差不多,只不过它学的东西更复杂,用的“脑子”不是咱们的大脑,而是电脑里的“数学模型”。今天咱们就用最通俗的话,把深度学习的来龙去脉、底层原理、怎么干活的、能干啥、有啥毛病都掰扯清楚,保证不管你是学生、上班族还是退休在家的朋友,都能听得明明白白。
一、先搞懂“AI、机器学习、深度学习”的关系:不是三个独立的东西,是“爷爷、爸爸、儿子”
很多人一听到AI、机器学习、深度学习就晕,总觉得是三个完全不一样的技术,其实它们是“包含关系”,就像“动物→哺乳动物→猫”一样,范围一个比一个小,精度一个比一个高。
咱们先画个简单的“包含圈”:最外面的大圈是AI(人工智能),意思就是“让机器像人一样能干活”,比如机器人扫地、手机语音助手说话、导航软件指路,都算AI的范畴。但AI是个“大目标”,怎么实现这个目标呢?得让机器先“学会东西”,这就有了中间的圈——机器学习。
机器学习就是“让机器自己从数据里找规律,不用人一步一步教”。比如你想让机器认猫,要是不用机器学习,就得让人写无数行代码:“如果这个动物有四条腿、有尾巴、毛是黄的、耳朵尖……那就是猫”,但世界上的猫有胖有瘦、有黑有白,代码根本写不完。而机器学习的思路是:给机器喂10万张猫的图片、10万张不是猫的图片,让它自己看“猫都有啥共同点”,下次再给一张新图片,它就能判断“这是不是猫”。
但机器学习也有缺点:要是数据太复杂,比如让它“从视频里判断人是不是在哭”,视频里有表情、声音、动作,机器学习就有点“力不从心”了——这时候就需要最里面的圈,也就是深度学习。
深度学习是机器学习的“升级版”,它能处理更复杂的数据,比如图片、声音、视频、文字,而且学东西的效率更高、准确率也更高。咱们现在用的ChatGPT、AI画图(比如Midjourney)、手机人脸识别、自动驾驶的“眼睛”,背后靠的全是深度学习。
简单总结一下:AI是目标,机器学习是实现目标的“方法群”,深度学习是机器学习里最厉害的“核心方法”。就像你想“做出好吃的(AI)”,“用锅做饭(机器学习)”是方法,而“用高压锅炖肉(深度学习)”是其中效率最高、味道最好的方法。
二、深度学习的“脑子”:不是真的“思考”,是“多层数学公式堆出来的网络”
咱们人靠大脑思考,大脑里有1000多亿个神经元,神经元之间互相连接,传递信号——深度学习的“脑子”,就是模仿这个结构做出来的,叫“神经网络”。但注意:这不是真的“神经”,就是一堆数学公式的集合,咱们叫它“人工神经网络”。
1. 最基础的“神经元”:就像一个“算账的小盒子”
先从最小的单位“神经元”说起。你可以把一个神经元想象成一个“小会计”,它干的活就三步:
第一步:“收钱”。它会从左边收到很多“钱”(这些“钱”其实是上一步的输入数据,比如图片的像素值、声音的频率),而且每笔“钱”都有一个“权重”——就像“这笔钱重要不重要”,权重高的钱,影响更大。比如认苹果时,“红色”的权重比“上面有没有斑点”高。
第二步:“算账”。小会计把每笔钱乘以对应的权重,加起来,再加上一个“偏置”(可以理解成“基础分”,比如不管有没有其他特征,先给个基础分,避免算出来的结果太极端)。比如“红色(5分)×权重0.8 + 圆形(4分)×权重0.7 + 偏置0.5 = 5×0.8+4×0.7+0.5=4+2.8+0.5=7.3”。
第三步:“输出结果”。算出来的7.3不能直接用,得经过一个“激活函数”处理——这个函数的作用是“让结果更像人判断的逻辑”。比如激活函数可以设定“如果结果大于5,就输出‘像苹果’;小于5,就输出‘不像苹果’”。
你看,一个神经元就是“输入→加权求和→激活→输出”的过程,本质上就是一个简单的数学计算。
2. 深度学习的“深度”:就是把神经元分成“多层”,一层接一层算
那“深度”体现在哪?就是把很多神经元分成好几层,比如“输入层→隐藏层→输出层”,隐藏层还能有好多层,层数越多,“深度”越深。
本小章还未完,请点击下一页继续阅读后面精彩内容!
喜欢大白话聊透人工智能请大家收藏:(www.qbxsw.com)大白话聊透人工智能全本小说网更新速度全网最快。