机器学习AI简介_成都软件开发

技术支持

技术支持分类

机器学习AI简介

作者：admin
发表时间：2019-03-09 22:23
来源：未知

1997年，Tom Mitchell提出了一个“适当的”数学和关系定义，“据说计算机程序可以从经验E中学习一些任务T和一些性能测量P，如果它在T上的表现，则通过P，随着经验E而提高

机器学习是最新的流行语。它值得，因为它是计算机科学最有趣的子领域之一。那么机器学习究竟意味着什么呢？

让我们试着用外行术语来理解机器学习。考虑一下你正试图把纸扔到垃圾箱里。

在第一次尝试之后，你意识到你已经施加了太大的力量。第二次尝试后，您会发现距离目标更近，但需要增加投射角度。这里发生的事情基本上是在每次投掷之后我们都在学习并改进最终结果。我们的计划是从我们的经验中学习。

这意味着机器学习所涉及的任务提供了基本的操作定义，而不是在认知术语中定义领域。这是艾伦图灵在他的论文“计算机器和智能”中提出的建议，其中“机器可以思考吗？”这个问题被“机器可以做我们（作为思考实体）能做什么？”这个问题所取代

。分析，机器学习用于设计复杂的模型和算法，使其有助于预测; 在商业用途中，这被称为预测分析。这些分析模型允许研究人员，数据科学家，工程师和分析师通过学习数据集（输入）中的历史关系和趋势，“产生可靠，可重复的决策和结果”并发现“隐藏的见解”。

假设您决定查看该假期的优惠。您浏览旅行社网站并搜索酒店。当您查看特定酒店时，在酒店描述的下方有一个标题为“您可能也喜欢这些酒店”的部分。这是机器学习的常见用例，称为“推荐引擎”。同样，根据他们已经了解的关于您的大量信息，许多数据点被用于训练模型以预测将在该部分下向您展示的最佳酒店。

因此，如果您希望程序预测繁忙交叉点（任务T）的流量模式，您可以通过机器学习算法运行它，其中包含有关过去流量模式的数据（经验E），如果已成功“学习” “，它将更好地预测未来的交通模式（绩效指标P）。

然而，许多现实问题的高度复杂性通常意味着发明专门的算法，每次都能完美地解决它们，即使不是不可能，也是不切实际的。机器学习问题的例子包括，“这是癌症吗？”，“这些人中哪一个是彼此的好朋友？”，“这个人会喜欢这部电影吗？”这样的问题是机器学习的优秀目标，事实上机器学习已经应用了这样的问题取得巨大成功。

机器学习的分类

机器学习实施分为三大类，取决于学习系统可用的学习“信号”或“响应”的性质，如下：

监督学习：当算法从示例数据和相关的目标响应中学习时，可以包含数值或字符串标签，例如类或标签，以便稍后在用新示例提出时预测正确的响应属于监督学习类别。这种方法确实类似于在老师的监督下的人类学习。教师为学生记忆提供了很好的例子，然后学生从这些具体的例子中得出一般规则。

无监督学习：当算法从没有任何相关响应的普通示例中学习时，留给算法自己确定数据模式。这种类型的算法倾向于将数据重组为其他内容，例如可能表示类的新特征或新的一系列不相关值。它们非常有用，可以让人们深入了解数据的含义以及监督机器学习算法的新有用输入。

作为一种学习，它类似于人类用来确定某些对象或事件来自同一类的方法，例如通过观察对象之间的相似程度。您在网络上以营销自动化的形式找到的一些推荐系统基于这种类型的学习。

强化学习：当您使用缺少标签的示例呈现算法时，如在非预测性学习中。但是，您可以根据算法提出的解决方案附带正反馈或负反馈的示例，该增强学习类别与算法必须做出决策的应用程序相关联（因此产品是规范性的，而不仅仅是描述性的，与无监督学习一样），决定带来后果。在人类世界中，这就像通过反复试验来学习一样。

错误有助于你学习，因为他们有一个惩罚（成本，时间的浪费，后悔，痛苦等），告诉你一定的行动方式不太可能成功。强化学习的一个有趣例子发生在计算机学习自己玩视频游戏时。

在这种情况下，应用程序向算法提供特定情况的示例，例如让游戏玩家陷入迷宫，同时避开敌人。该应用程序让算法知道它所采取的行动的结果，并且在试图避免它发现的危险和追求生存的过程中进行学习。您可以了解Google DeepMind公司如何创建一个强化学习计划，播放旧的Atari视频游戏。观看视频时，请注意该节目最初是如何笨拙和不熟练，但通过培训稳步提高，直到它成为冠军。

半监督学习：给出不完整的训练信号：训练集，其中一些（通常很多）目标输出丢失。这个原理的特殊情况称为Transduction，其中整个问题实例集在学习时已知，除了缺少部分目标。

分类需要输出的基础上，

当考虑机器学习系统的期望输出时，出现机器学习任务的另一种分类：

分类：当输入分为两个或更多个类时，学习者必须生成一个模型，该模型将看不见的输入分配给这些类的一个或多个（多标签分类）。这通常以受监督的方式解决。垃圾邮件过滤是一种分类示例，其中输入是电子邮件（或其他）邮件，类别是“垃圾邮件”和“非垃圾邮件”。

回归：这也是一个监督问题，输出是连续的而不是离散的情况。

聚类：将一组输入分组。与分类不同，这些组事先是未知的，因此通常是无人监督的任务。

当通过典型方法无法解决问题时，机器学习就会出现。