互联网资讯 / 人工智能 · 2023年11月7日 0

Python机器学习指南

Python机器学习指南

本机器学习教程提供了机器学习的基本和中间概念。它是为完全入门的学生和专业工作人员而设计的。在本教程的最后,您不会成为机器学习方面的专家,但是您将能够制作能够执行复杂任务(例如,预测房屋价格或从尺寸识别虹膜的种类)的机器学习模型。花瓣和萼片的长度。如果您还不是一个完整的初学者,并且对机器学习有所了解,那么我建议您从子主题八开始,即机器学习类型。

在进入本教程之前,您应该熟悉Pandas和NuMPy。这对于理解实现部分很重要。以下是我们将在本教程中讨论的子主题:

什么是机器学习? 它与传统编程有何不同? 为什么我们需要机器学习? 机器学习的历史 目前的机器学习 机器学习的特点 机器学习的最佳语言是什么? 机器学习的类型 监督学习 无监督学习 强化学习 机器学习算法 机器学习步骤 机器学习的优势 未来的机器学习

什么是机器学习?

亚瑟·塞缪尔(ARthuR SaMuel)在1959年创造了“机器学习”一词。他是人工智能和计算机游戏的先驱,并将机器学习定义为“使计算机无需明确编程即可学习的能力的研究领域”。

简而言之,机器学习是人工智能(AI)的一种应用程序,它使程序(软件)可以从经验中学习并提高自己在完成一项任务时的自我,而无需进行明确的编程。例如,您将如何编写一个程序来根据水果的各种属性(例如颜色,形状,大小或任何其他属性)识别水果?

一种方法是对所有内容进行硬编码,制定一些规则并使用它们来识别结果。这似乎是唯一可行的方法,但永远无法制定适用于所有情况的完善规则。使用机器学习可以轻松解决此问题,而无需任何规则,这使其变得更加健壮和实用。您将在接下来的部分中看到我们将如何使用机器学习来完成此任务。

因此,我们可以说,机器学习是通过使机器具有最少的人工干预(即无需显式编程)进行学习的能力,从而使机器的行为和决策更具人性化。现在出现了一个问题,程序如何获得任何经验以及从中学习?答案是数据。数据也被称为机器学习的动力,我们可以肯定地说没有数据就没有机器学习。

您可能想知道,机器学习一词是在1959年引入的,它可以追溯到很久以前,那么为什么直到最近几年都没有提及它?您可能需要注意,机器学习需要巨大的计算能力,大量数据以及能够存储如此庞大数据的设备。我们直到最近才满足所有这些要求并可以练习机器学习。

它与传统编程有何不同?

您是否想知道机器学习与传统编程有何不同?好吧,在传统编程中,我们会将输入数据以及经过良好编写和测试的程序馈入机器中以生成输出。当涉及到机器学习时,在学习阶段,输入数据以及与数据相关联的输出将被馈送到机器中,并为自己制定程序。

如果您不能完全理解这些内容,请不要担心,在接下来的部分中,您将获得更好的理解。

为什么我们需要机器学习?

当今的机器学习具有它所需要的全部注意力。机器学习可以使许多任务实现自动化,尤其是只有人类才能利用其固有的智能来执行的任务。仅在机器学习的帮助下,才能将这种智能复制到机器上。

在机器学习的帮助下,企业可以自动化日常任务。它还有助于自动化并快速创建数据分析模型。各个行业都依赖大量数据来优化其运营并做出明智的决策。机器学习有助于创建可以处理和分析大量复杂数据以提供准确结果的模型。这些模型精确,可扩展,并且具有更少的周转时间。通过构建这种精确的机器学习模型,企业可以利用有利可图的机会并避免未知的风险。

图像识别,文本生成和许多其他用例正在现实世界中找到应用。这扩大了机器学习专家成为受追捧的专业人员的视野。

目前的机器学习

在2012年,Alex KRizhevsky,GeoFFRey Hinton和Ilya SutskeveR发表了有影响力的研究论文,描述了一种可以显着降低图像识别系统错误率的模型。同时,谷歌的X Lab开发了一种机器学习算法,该算法能够自主浏览Youtube视频,以识别包含猫的视频。2016年,AlphaGo(由Google DeepMind的研究人员创建,用于玩中国古代的围棋游戏)在与Lee Sedol的五场比赛中赢得了四场比赛的胜利,Le Sedol是十多年来一直是世界顶级围棋选手。

现在,在2020年,OpenAI发布了GPT-3,这是有史以来功能最强大的语言模型。它可以编写有创意的小说,生成功能代码,撰写周到的业务备忘录等。它的可能用例仅受我们的想象力限制。

机器学习的特点

自动化:如今,您的Gmail帐户中有一个垃圾邮件文件夹,其中包含所有垃圾邮件。您可能想知道GMAIl如何知道所有这些电子邮件都是垃圾邮件?这是机器学习的工作。

它可以识别垃圾邮件,因此很容易实现此过程的自动化。自动执行重复任务的能力是机器学习的最大特征之一。大量组织已经在使用基于机器学习的文书工作和电子邮件自动化。

例如,在金融部门,需要执行大量重复,数据繁重和可预测的任务。因此,该行业在很大程度上使用了不同类型的机器学习解决方案。

改善客户体验:对于任何企业而言,提供定制体验和提供更好的服务,是提高参与度,提升品牌忠诚度和建立长期客户关系的最关键方法之一。

机器学习可以帮助我们实现两者。您是否曾经注意到,无论何时打开任何购物网站或在互联网上看到任何广告,它们大多与您最近搜索的内容有关?这是因为机器学习使我们能够做出精确的惊人推荐系统。它们帮助我们定制用户体验。

在开始使用该服务,如今,大多数公司都拥有一个聊天机器人,可以全天候(24&tiMes;7)使用。例如,亚航的Eva。这些机器人提供了智能的答案,有时您甚至可能没有注意到自己正在与机器人对话。

自动化数据可视化:过去,我们已经看到公司和个人正在生成大量数据。以Google,TwITteR,FACEbook等公司为例。他们每天产生多少数据?我们可以使用这些数据并可视化显着的关系,从而使企业能够制定更好的决策,从而使公司和客户都从中受益。

借助用户友好的自动化数据可视化平台(例如AutOViz),企业可以获取大量新见解,从而提高流程的生产率。

商业智能:机器学习特性与大数据分析结合使用时,可以帮助公司找到解决问题的方法,这些问题可以帮助企业发展并产生更多的利润。

从零售到金融服务再到医疗保健,等等,机器学习已经成为促进业务运营的最有效技术之一。

机器学习的最佳语言是什么?

尽管有许多可用于机器学习的语言,但据我称,Python是机器学习应用程序的最佳编程语言。这是由于以下部分提到的各种好处。可以用于机器学习应用程序的其他编程语言是R,C ++,JavaScRIPt,Java,C#,Julia,Shell,typescRIPt和Scala。R还是一种非常好的机器学习入门语言。

与其他编程语言相比,Python以其可读性和相对较低的复杂性而闻名。机器学习应用程序涉及复杂的概念,例如微积分和线性代数,这些实现需要花费很多精力和时间。Python通过快速实施来帮助机器学习工程师验证想法,从而减轻了负担。您可以查看《Python教程》以获得对该语言的基本了解。在机器学习中使用Python的另一个好处是预构建的库。如下所述,针对不同类型的应用程序有不同的软件包:

在处理图像时使用NuMpy,OpenCV和ScikIT 文本处理时,NLTK与NuMpy和ScikIT一起 LibRosa用于音频应用 Matplotlib,SeaboRn和ScikIT用于数据表示 用于深度学习应用程序的TensoRFlow和PyTorch 科学计算科学 Django,用于集成Web应用程序 熊猫用于高级数据结构和分析

Python提供了在面向对象的编程或脚本之间进行选择的灵活性。也不需要重新编译代码。开发人员可以实施任何更改并立即查看结果。您可以将Python和其他语言一起使用以实现所需的功能和结果。

Python是一种通用的编程语言,可以在任何平台上运行,包括Windows,MacOS,linux,Unix等。从一个平台迁移到另一个平台时,代码需要进行一些小的改动和更改,并且可以在新平台上使用了。

以下是使用Python解决机器学习问题的好处的摘要:

Python机器学习指南

机器学习的类型

机器学习大致分为三类

监督学习 无监督学习 强化学习

什么是监督学习?

让我们从一个简单的例子开始,说您正在教一个孩子区分狗和猫。你会怎么做?

您可以给他/她看狗,然后说“这是狗”,遇到猫时您会指出它是猫。当您向孩子展示足够多的猫狗时,他可能会学会区分它们。如果他训练有素,他也许就能认出他从未见过的不同品种的狗。

同样,在监督学习中,我们有两组变量。一种称为目标变量,或称为标签(我们要预测的变量)和特征(可帮助我们预测目标变量的变量)。

我们向程序(模型)显示功能以及与这些功能关联的标签,然后程序便能够在数据中找到潜在的模式。以该数据集的示例为例,在该数据集中我们要根据房屋的大小来预测房屋的价格。作为目标变量的价格取决于作为特征的尺寸。

NuMbeR of RooMs price 1 $100 3 $300 5 $500

在真实的数据集中,我们将有更多的行和不止一个功能,例如大小,位置,楼层数等等。

因此,可以说监督学习模型具有一组输入变量(x)和一个输出变量(y)。一种算法识别输入和输出变量之间的映射函数。关系为y = f(x)。

在我们已经知道输出和算法每次都得到更正以优化其结果的意义上,对学习进行监视或监督。对数据集进行算法训练并对其进行修改,直到达到可接受的性能水平。

我们可以将有监督的学习问题归类为:

回归问题–用于预测未来价值,并使用历史数据对模型进行训练。例如,预测房屋的未来价格。

分类问题–各种标签训练算法以识别特定类别中的项目。例如,狗或猫(如上例中所述),苹果或橙子,啤酒或葡萄酒或水。

什么是无监督学习?

这种方法是没有目标变量,只有输入变量(特征)的方法。该算法可自行学习并在数据中发现令人印象深刻的结构。

目的是破译数据中的基础分布,以获得有关数据的更多知识。

我们可以将无监督学习问题分组为:

聚类:这意味着将具有相同特征的输入变量捆