登陆

章鱼彩票app官网下载-Andrew Ng的《Machine Learning Yearning》中六个重要概念

admin 2019-05-11 225人围观 ,发现0个评论

本文为 AI 研习社编译的技能博客,原标题 :

6 concepts of Andrew NG’s book: “Machine Learning Yearning”

作者 | Niklas Donges

翻译 | 我系墙颈鹿~、GuardSkill、约翰逊 李加薪、谢玄xx、Tree123456

校正 | 酱番梨 审阅 | 邓普斯•杰弗收拾 | 立鱼王

原文链接:

https://towardsdatascience.com/6-concepts-of-andrew-ngs-book-machine-learning-yearning-abaf510579d4

Machine Learning Yearning这本书叙述了怎么构建机器学习项目。 这本书包含了难以在其他当地找到的有用见地,而且这本书的格局易于与队友和合作者共享。 大多数技能人工智能课程将向您解说不同的ML算法的暗地作业原理,但本书将教您怎么实际运用它们。 假如您巴望成为AI的技能的引领者,本书将对您有很大的协助。 在这之前,学习到怎么拟定人工智能项目战略性的决议计划的仅有办法是参与研讨生课程或在公司作业获取经历。 Machine Learning Yearning 能够协助您快速把握这项技能,使您能够更好地构建杂乱的AI体系。

目录

Andrew NG是计算机科学家,执行官,投资人,企业家,也是人工智能范畴的抢先专家之一。 他是百度的上一任副总裁兼首席科学家,是斯坦福大学的兼职教授,是最受欢迎的机器学习在线课程的创立者之一,Coursera.com的联合创始人以及Google Brain的前负责人。 在百度,他的积极参与将人工智能团队扩展到数千人。

简介

这本书从这样一个小故事开端:幻想一下,你想树立一个一家公司,它具有前沿的猫检测体系。现在你现已构建了一个原型体系,但不幸的是,体系功能并不是那么好。 你的团队提出了一些怎么改善体系的主意,但你对改善办法的选取感到困惑。 现在,你能够构建世界抢先的猫检测器渠道,或许在过错的改善方向上糟蹋几个月的时刻。

这本书是通知你怎么在这种状况下决议和优先排序的。 吴恩达曾说过,大多数机器学习问题都会留下许多头绪,这些头绪会提示你最有用的后续进程以及你应该防止做什么。吴恩达还接着解说道,在机器学习范畴,学习“阅览”这些头绪是一项重要的技能。

简而言之,ML Yearning旨在让您深化了解一些改善机器学习项意图技巧性方向。

由于您的团队成员在当你提出新的干事主意时或许会持怀疑态度,因而吴恩达将本章节(简介)进行了缩短(只要1-2页),以便您的团队成员能够在几分钟内阅览它以了解概念背面的主意。假如您有爱好阅览这本书,请注意它其实并不合适初学者,由于它要求读者对监督的学习和深度学习有根本的了解。

在这篇短文中,依据我的了解,我将用我自己的表达方式来共享这本书的六个概念。

概念1:迭代,迭代,迭代......

NG(吴恩达)在整本书中都在着重,快速迭代是至关重要的,由于机器学习是一个迭代进程。您应该尽或许快地为您的问题构建构建一个简略的原型,而不是考虑怎么打造愈加完美的ML(机器学习)体系。假如您不是机器学习问题范畴的专家,则更应该这样做,由于要正确地猜想最有期章鱼彩票app官网下载-Andrew Ng的《Machine Learning Yearning》中六个重要概念望的方向是十分困难的。

您应该在短短几天内构建第一个原型,然后头绪将会显现出来,向您展现改善原型功能的最有期望的方向。鄙人一次体系的迭代中,您将依据这些头望洞庭古诗绪之一改善体系并构建其新的版别。你会一次又一次地这章鱼彩票app官网下载-Andrew Ng的《Machine Learning Yearning》中六个重要概念样来更新机器学习体系。

他持续解说说,迭代地越快,你将获得的发展越多。本书的其他概念树立在这一准则之上。请注意,这适用于那些只想构建依据AI的运用程序而不在该范畴进行研讨的人员。

概念2:运用单一点评规范

这个概念树立在前一个概念的基础上,而且要解说为什么您应该挑选一种点评规范十分简略:它让您能够快速点评算法,因而您能够更快地迭代。运用多个点评目标只会使算法的比较变得愈加困难。

幻想一下,你有两种算法。第一个的精度为94%,召回率为89%。第二个的精度为88%,召回率为95%。

假如你没有挑选单一的点评规范,章鱼彩票app官网下载-Andrew Ng的《Machine Learning Yearning》中六个重要概念那么就没有分类器有明显的优越性,所以你或许不得不花一些时刻来弄理解哪个分类器更好。问题是,你在每次版别迭代时都会糟蹋许多时刻完结这项使命,而且从长远来看这种时刻会添加。您将测验许多关于体系结构,参数,特征等的主意。假如您运用单一点评规范(例如精度或f1分数),则能够依据其模型功能对一切模型进行排序,并敏捷决议哪一个最佳。改善点评进程的另一种办法是将多个点评规范组合成单个点评规范,例如,经过均匀多个差错点评规范。

但是,将存在需求满意多个 点评规范的ML(机器学习)问题,例如:有些问题需求考虑运转时刻。 NG(吴恩达)解说说,您应该界说一个“可承受的”运转时刻,这使您能够快速过滤掉出太慢的算法,并依据您的单一点评规范将令人满意的算法彼此比较。

简而言之,单一点评规范使您能够快速点评算法,然后更快地进行版别迭代。

概念3: 过错剖析很重要

过错剖析是检查算法哪里输出不正确的进程。 例如,假定当你的猫分类器会过错的将鸟类分类为猫,你或许现已有若干个改善主意。

经过正确的过错剖析,你能够点评改善主意是否会真的进步体系的功能,而不需求在花费几个月的时刻完成这个主意后却意识到它对体系并不重要。这能够决议将资源花在哪个主意上到达好的作用。假如你发现过错分类的图画中只要9%是鸟类,那么无论怎么改善算法对鸟类图画的功能都没有影响,由于它不会进步逾越9%的过错。

此外,它能够协助你一起快速点评判别若干改善的主意的功能。只需求创立并填写一个电子表格,一起检查100个过错分类的验证集图画。在电子表格中,为每一个分类过错的图画创立一行,为每一个需求改善的主意创立列。然后你仔细检查每一个过错分类的图画,并标记出正确分类的图画。

之后,你就会知道精确的点评成果. 例如,运用主意1,体系能够正确地对40%的未分类图画进行分类,主意2为12%,主意3仅为9%。然后你就会知道,对你的团队来说主意1最有价值。

此外,一旦你开端检查这些示例,你或许会对怎么改善算法发作新主意。

概念4:界说最优过错率

最优过错率有助于辅导您进行后续的学习。在计算中,它一般也称为贝叶斯过错率。

幻想一下,您正在将构建一个语音-文本体系,而且发现您期望用户提交音频文件的19%都具有如此明显的布景噪音,即使是人类也无法辨认那里所说的内容。假如是这种状况,您就会知道——即使是最好的体系也或许会呈现大约19%的差错。相反,假如您处理的问题的最佳过错率挨近0%,您就能够期望您的体系也能做到这一点。

最优过错率还能够协助您检测算法是否存在高误差或方差,这有助于您在后续进程中改善算法。

但是,咱们怎么知道最佳过错率是多少?关于人类拿手的使命,您能够将体系的功能与人类的功能进行比较,然后估算出最佳过错率。在其他状况下,一般很难确认,这便是你应该能够处理人类能够做得好的某些问题的原因,而这些原因咱们将鄙人一个概念中评论。

概念5:研讨那些人类能够做得好的问题

在整本书中,吴恩达屡次解说为什么他主张人们去研讨那些人类自己能够做的满足好的机器学习类问题,如章鱼彩票app官网下载-Andrew Ng的《Machine Learning Yearning》中六个重要概念语音辨认,图画分类,物体检测等。原因如下:

首要,获取或创立有标示的数据集更简单,由于假如人们能够自己处理问题的话,他们能够直接为学习算法供给高精度标签。

其次,您能够将人类体现作为您期望自己编写的算法所能到达的最佳过错率。吴恩达解说说,界说合理且可完成的最佳过错有助于加速团队的研讨进展。它还能够协助您检测您的算法是否存在高误差或方差。

第三,它使您能够依据您的人类直觉进行过错剖析。例如,假如您正在构建语音辨认体系,且您的模型对其章鱼彩票app官网下载-Andrew Ng的《Machine Learning Yearning》中六个重要概念输入进行了过错分类,您就能够测验了解人类将运用哪些信息来获取正确的转录,并运用此信息相应地修正学习算法。虽然在越来越多人类自己无法做好的使命中,算法在不断地逾越人类,但你应该尽量防止这些问题。

总而言之,您应该防止这些使命,由于它使得获取数据的标签变得愈加困难,您也不能总依赖于人类的直觉。而且,咱们也很难知道最佳过错率是多少。

概念6:怎么切割数据集

吴恩达教师还提出了一种怎么切割数据集的办法。他主张如下:

练习集:运用它,你能够练习你的算法,而不需求其他任何东西。

开发集:这个调集用于进行超参数调整、挑选和创立恰当的特性以及进行过错剖析。它根本上是用来决议你的算法的。

测验集:测验集用于点评体系的功能,但不用于做决议。它仅仅用来点评的,没有其他。

开发集和测验集答应您的团队快速点评算法的功能。它们的意图是辅导您对体系进行最重要的更改。

他主张挑选开发和测验集,以便它们反映出您期望在布置体系后在将来能够很好地处理的数据。假如您期望数据与当时正在练习的数据不同,则特别如此。例如,您正在承受一般相机图画的练习,但稍后体系将只接纳手机拍照的相片,由于它是移动运用程序的一部分。假如你没有满足的手机相片来练习你的体系,这种状况或许会发作。因而,您应该挑选测验集示例,这些示例反映出您期望在今后的实际状况中体现出色的内容,而不是用于练习的数据。雷锋网雷锋网雷锋网

别的,您应该挑选来自同一发行版的开发和测验集。不然,您的团队有或许会在开发人员集上构建一些功能杰出的东西,成果发现它在测验数据上的功能十分差,这是您应该关怀的。

总结

在这篇文章中,您现已了解了《Machine Le章鱼彩票app官网下载-Andrew Ng的《Machine Learning Yearning》中六个重要概念arning Yearning》这本书中的6个概念。现在您知道了,为什么快速迭代很重要,为什么应该运用单个数字点评衡量,以及什么是过错剖析,以及为什么它至关重要。此外,您还了解了最佳过错率、为什么您应该处理人类能够做得很好的问题以及怎么切割数据。此外,您还了解到,您应该挑选开发和测验集数据,以便它们反映出您期望在将来很好地处理的数据,而且开发和测验集应该来自相同的分发。我期望这篇文章能给你介绍一下这本书的一些概念,我能够肯定地说,这本书值得一读。

这篇文章开始宣布在我的博客上(https://machinelearning blog.com)。

来历

想要持续检查该篇文章相关链接和参考文献?

点击即可拜访:

社长今天引荐:2019 最新斯坦福 CS224nNLP 课程

自然言语处理(NLP)是信息时代最重要的技能之一,也是人工智能的要害部分。NLP的运用无处不在,由于人们简直用言语进行沟通:网络查找,广告,电子邮件,客户服务,言语翻译,医学陈述等。近年来,深度学习办法在许多不同的NLP使命中获得了十分高的功能,运用单个端到端神经模型,不需求传统的,使命特定的特征工程。在本课程中,学生将深化了解NLP深度学习的前沿研讨。

课程链接:https://ai.yanxishe.com/page/groupDetail/59

声明:该文观念仅代表作者自己,搜狐号系信息发布渠道,搜狐仅供给信息存储空间服务。
请关注微信公众号
微信二维码
不容错过
Powered By Z-BlogPHP