Skip to content Skip to footer

人工智能如何真正学会变得聪明

image-20240122003505104

随着人工智能 (AI) 和机器学习 (ML) 等术语在新闻报道和流行文化中占据主导地位,越来越多的人对这些降临技术感兴趣(和固执己见)。然而,人工智能科学家或机器学习工程师与公众之间在他们对模型智能意味着什么的看法方面存在巨大差距。解释人工智能和机器学习的资源(文章、视频等)通常要么过于繁重,要么被淡化到实际上没有教任何东西的地步,这一事实加剧了这个问题。这使得许多想要了解 ML 和 AI 的人处于一个不受欢迎的地方,他们要么被数学拒之门外,要么只是通过阅读和观看化的内容对 AI 产生误导或错误理解。此外,在没有任何数学的情况下解释ML和AI通常涉及自由使用与人脑有关的类比,并可能给人们一种概念,即AI和ML确实以人们的方式学习和成长,导致乐观或悲观不一定植根于现实。在这篇文章中,我试图在这两种通用方法之间找到一个中间地带,并以一种基于现实(高中水平数学)的方式解释人工智能和机器学习,同时抽象出过于数学化的想法。

为了回答人工智能如何学习智能的问题,首先要区分人工智能背景下的智能学习。虽然如今人工智能经常被用作许多尖端技术的总称,但人工智能机器学习之间实际上是有区别的。思考它们的一种简单方法是,当人工智能做出决策时,机器学习使这些决策随着时间的推移变得越来越智能。另一个常见的误解是,当引入ML时,模型或机器人会变得人工智能。以一个简单的吸尘机器人为例。该机器人可以随机穿越房间的地板,在存在污垢时用吸尘器吸尘地板。这个机器人在计算机科学中被称为简单的反射代理,它不会随着时间的推移而学会更有效率或更好,但仍然会做出合乎逻辑的决定(根据污垢的存在穿越或吸尘地板)。因此,该机器人属于 AI 类别,但不属于 ML。另一方面,可以执行对象检测(玩具、鞋子等)的模型是 ML 的一个例子,但不一定是 AI,因为该模型只是学习检测对象并对其进行分类,而无需对此类分类进行任何其他操作。如果我们将物体检测模型与这种吸尘机器人相结合,让机器人在清洁地板时避开某些物体,这将是人工智能和机器学习结合使用的一个例子。

机器学习智能的机器或模型通常是人们在人工智能讨论的背景下感到兴奋或恐惧的地方,揭开这一学习过程的神秘面纱将是本文的大部分内容。

那么,机器学习模型实际上是如何学习的呢?答案是通过培训。

image-20240122003533943

考虑上面的这个基本图表。我们想找到最能将蓝色圆圈与红色三角形分开的线(粉红色)。目标是在数学上将这条粉红色线绘制在图形上,这样我们就可以简单地说这条线上的任何内容都必须是蓝色圆圈,而下面的任何内容都将是红色三角形(并且是正确的)。

image-20240122003548485

粉红线随时间的演变

这条粉红色线在开始时可能不太擅长分隔蓝色圆圈和红色三角形。机器学习的训练方面是指查看图形中许多蓝色圆圈和红色三角形的示例,然后慢慢改进粉红色线以捕获圆圈和三角形之间的分离的过程。那么,我们怎样才能真正改进粉红线,使其更准确呢?这就是我们使用微积分的地方。

一开始,粉线很可能是随机初始化的,不是很准确。蓝色圆圈将与红色三角形聚集在一起,反之亦然。我们要注意的是这条粉红线“不正确”的数值程度。理想情况下,我们希望对图中的每个数据点都这样做。对于图中的每个圆圈和三角形,我们查看当前的粉红色线,并确定它是正确还是错误地分类,以及分类了多少。

image-20240122003602976

我们可以计算所有圆和三角形相对于粉红线的不正确程度,并将其转换为函数。此函数通常称为损失成本函数。

image-20240122003616089

以 2D 形式绘制的任意损失函数

从这个角度可以看出,改善粉红线类似于最小化损失函数。换句话说,如果我们能将损失降到最低,我们就可以改善粉红线。如果你对微积分有基本的高中水平的理解,你就会知道找到一个函数的最小值只是取函数的导数并将导数设置为 0。一种通常用于最小化损失函数的方法称为[梯度下降](https://www.ibm.com/topics/gradient-descent#:~:text=Gradient descent is an optimization,each iteration of parameter updates.)。

image-20240122003628113

损失函数的最小值

使用微积分来最小化错误,从而改善这条粉红色线是我们训练模型的方式。以省略许多数学和逻辑细节为代价,这本质上是机器学习的方式

image-20240122003638983

在建立了一条相当不错的粉红线之后,我们现在可以使用这个经过训练的模型对全新的未知数据进行分类。这个全新的数据,用棕色标记为问号,根据它在图中相对于粉红色线的位置进行分类(在这种情况下,它将归类为红色三角形)。

这听起来很简单,但这确实是ML和AI如何学习“智能”的基础。这个简单的过程是最终实现图像识别、文本生成、乳腺癌识别等的基础。如果我们用“良性肿瘤”代替蓝色圆圈,用“黑色素瘤”代替红色三角形,那么为什么这个看似微不足道的“找到粉红线”的过程会非常有影响力就更清楚了。

本文中使用的示例非常简单,它们旨在成为。在现实中,“粉红线”往往根本不是一条线。有时它会是一整个平面(就像一张纸),像我们的粉红色线切割二维图形一样切开 3 维空间。有时,要训练的数据可能位于 3 维之外的多维空间中。同样,我省略了实际构建机器学习模型(如神经网络)所需的许多数学细节。对于感兴趣的读者来说,对线性代数、微积分和统计学的一些基本理解可以在这段旅程中大有帮助。

在本文中,我试图用最简单的术语解释 AI 和 ML 中的学习过程,同时不回避绝对必要的数学概念。希望这篇文章能对机器学习模型的工作原理有所了解,并为您提供一些工具来辨别关于人工智能和机器学习的不合理乐观或恐惧的观点,这些观点似乎主导了公共话语(即,在讨论人工智能时,也许终结者不应该成为你的主要证据来源)。与许多事情一样,唯一需要害怕的是数学本身。