人工智能中的代理人_成都软件开发

技术支持

技术支持分类

人工智能中的代理人

作者：成都软件开发
发表时间：2019-03-15 21:52
来源：未知

人工智能被定义为对理性代理人的研究。理性代理人可以是做出决策的任何事情，例如人，公司，机器或软件。在考虑过去和当前的感知（代理人在特定情况下的感知输入）之后，它执行具有最佳结果的动作。

AI系统由代理及其环境组成。代理人在他们的环境中行事。环境可能包含其他代理。代理是可以被视为的任何东西：

通过感知周围环境传感器和

通过执行器作用于该环境

注意：每个代理都可以感知自己的行为（但并不总是影响）

为了理解智能代理的结构，我们应该熟悉架构和代理程序。架构是代理执行的机制。它是一种带有传感器和执行器的设备，例如：机器人汽车，相机，PC。代理程序是代理函数的实现。一个代理功能是从（即代理已经察觉，直到日期，所有的历史），以一个动作知觉序列图。

代理=架构+代理程序

代理的例子： -

一个软件代理具有击键，文件的内容，接收到的网络包充当屏幕上的传感器和显示器，文件，发送网络数据包作为执行机构。

一个人的代理人有眼睛，耳朵，并充当传感器和手，脚，嘴，并作为执行机构身体其他部位其他器官。

甲机器人剂具有摄像机和红外线测距仪充当传感器和用作致动器的各种电动机。

代理商的类型

代理可以根据其感知智能和能力的程度分为四类：

简单的反射代理

基于模型的反射代理

基于目标的代理商

基于效用的代理

简单的反射剂

简单反射代理忽略了感知历史的其余部分，并且仅基于当前感知来行动。感知历史是代理人迄今为止所感知的所有历史。代理功能基于条件 - 动作规则。条件 - 动作规则是将状态即条件映射到动作的规则。如果条件为真，则执行操作，否则不执行。只有在完全可观察环境时，此代理函数才会成功。对于在部分可观察环境中操作的简单反射代理，无限循环通常是不可避免的。如果代理可以随机化其动作，则可以从无限循环中逃脱。简单反射代理的问题是：

智力非常有限。

不了解非感性的国家部分。

通常太大，无法生成和存储。

如果环境发生任何变化，则需要更新规则集合。

基于模型的反射代理

它通过查找条件与当前情况匹配的规则来工作。基于模型的代理可以通过使用关于世界的模型来处理部分可观察的环境。代理必须跟踪内部状态，该内部状态由每个感知调整并且取决于感知历史。当前状态存储在代理内部，该代理维护某种描述世界中无法看到的部分的结构。更新状态需要以下信息：

世界如何独立于代理人而发展，以及

代理人行为如何影响世界。

基于目标的代理商

这些代理人根据他们目前离目标的距离（理想情况的描述）做出决定。他们的每一个行动都是为了减少与目标的距离。这允许代理人在多种可能性中进行选择，选择达到目标状态的那种可能性。支持其决策的知识被明确表示并且可以被修改，这使得这些代理更加灵活。他们通常需要搜索和规划。基于目标的代理的行为可以很容易地改变。

基于效用的代理

开发出具有最终用途作为构建块的代理被称为基于效用的代理。当有多种可能的替代方案，然后决定哪一种是最好的，使用基于效用的代理。他们根据每个州的偏好（效用）选择行动。有时达到预期目标是不够的。我们可能会寻找更快，更安全，更便宜的旅行来到达目的地。应该考虑代理人的幸福。Utility描述了代理人的“快乐”程度。由于世界的不确定性，公用事业代理选择最大化预期效用的行动。效用函数将状态映射到描述相关幸福程度的实数。