干货丨8种用Python实现线性回归的方法
技术文章 / 2018-02-21

今天,让我们来谈谈线性回归。没错,作为数据科学界元老级的模型,线性回归几乎是所有数据科学家的入门必修课。抛开涉及大量数统的模型分析和检验不说,你真的就能熟练应用线性回归了么?未必! “宝刀不老”的线性回归 时至今日,深度学习早已成为数据科学的新宠。即便往前推10年,SVM、boosting等算法也能在准确率上完爆线性回归。 为什么我们还需要线性回归呢? 一方面,线性回归所能够模拟的关系其实远不止线…

2017年深度学习必读31篇论文(附下载地址)
技术文章 / 2018-02-21

2017年即将擦肩而过,Kloud Strife在其博客上盘点了今年最值得关注的有关深度学习的论文,包括架构/模型、生成模型、强化学习、SGD & 优化及理论等各个方面,有些论文名扬四海,有些论文则非常低调。 一如既往,首先,标准免责声明适用,因为今年仅与GAN有关的论文就超过1660篇。我肯定会有疏漏,试图缩减到每两周一篇论文,包含了Imperial Deep Learning Read…

入门十大Python机器学习算法(附代码)
技术文章 / 2018-01-29

今天,给大家推荐最常用的10种机器学习算法,它们几乎可以用在所有的数据问题上: 1、线性回归 线性回归通常用于根据连续变量估计实际数值(房价、呼叫次数、总销售额等)。我们通过拟合最佳直线来建立自变量和因变量的关系。这条最佳直线叫做回归线,并且用 Y= a *X + b 这条线性等式来表示。 理解线性回归的最好办法是回顾一下童年。假设在不问对方体重的情况下,让一个五年级的孩子按体重从轻到重的顺序对班…

应用丨AI和机器学习如何改变美国政府决策方式
技术文章 / 2018-01-29

在每个联邦机构中,重要的见解都隐藏在多年来收集的大量数据集中。但是由于联邦政府数据科学家的短缺,从这些数据中提取价值是非常耗时的。然而,随着数据科学,人工智能(AI)和机器学习的进步,各机构现在可以使用先进的工具来转换信息分析和代理业务。 从预测恐怖威胁到检测税务欺诈,一种称为自动机器学习的新一类企业级工具,有能力通过预测建模来改变联邦决策的速度和准确性。像AI这样的技术正在改变联邦政府理解和决策…

深入浅出人脸识别技术
技术文章 / 2018-01-24

在深度学习出现后,人脸识别技术才真正有了可用性。这是因为之前的机器学习技术中,难以从图片中取出合适的特征值。轮廓?颜色?眼睛?如此多的面孔,且随着年纪、光线、拍摄角度、气色、表情、化妆、佩饰挂件等等的不同,同一个人的面孔照片在照片象素层面上差别很大,凭借专家们的经验与试错难以取出准确率较高的特征值,自然也没法对这些特征值进一步分类。深度学习的最大优势在于由训练算法自行调整参数权重,构造出一个准确率…

颠覆高等教育 机器学习将带来个性化的教育体验
行业资讯 / 2017-12-24

谁会想到,自动驾驶汽车的故事竟然会成真,甚至机器学习算法能够带动计算机与人类交流、驾驶汽车、玩游戏,也可以做人类无法做到的事情。数学算法驱动的机器学习以及科学创新已经成为我们生活的重要组成部分。例如,谷歌应用概率算法自动纠正拼写错误的单词,这一动作应用了机器学习的原理。机器学习对数百万其他用户积累所组成的搜索数据库进行比对,从而预测我们准备使用的单词。 随着科学技术的不断发展,机器学习也即将成为高…

不搞你就Out了!数据专家告诉你如何在企业中整合机器学习
技术文章 / 2017-12-24

世界经历过工业革命,现在我们正处于数字革命的时代。机器学习、人工智能和大数据分析是当今世界的现实。 我最近有机会与Talend副总裁CiaranDynes以及Datalytyx主管JustinMullen交谈。Talend是一家软件集成供应商,主要为企业提供大数据解决方案,而Datalytyx是大型数据工程、数据分析和云解决方案业务的领先提供商,其提供的服务能够让企业运营更快、更有效、更有利润。 …

在生产环境使用Kafka构建和部署大规模机器学习
技术文章 / 2017-12-22

使用Apache Kafka在生产环境构建大规模机器学习 智能实时应用为所有行业带来了革命性变化。机器学习及其分支深度学习正蓬勃发展,因为机器学习让计算机能够在无人指引的情况下挖掘深藏的洞见。这种能力正是多种领域所需要的,如非结构化数据分析、图像识别、语音识别和智能决策,这完全不同于传统的编程方式(如Java、.NET或Python)。 机器学习并非新生事物,大数据集的出现和处理能力的进步让每一个…

Pylearn2:一个基于Theano的机器学习库
技术文章 / 2017-12-03

Pylearn2是一个基于Theano的机器学习库,它的大部分功能是基于Theano顶层实现的。这意味着用户可以用数学表达式去编写Pylearn2插件(新模型、算法等),Theano不仅会帮助用户优化这些表达式,并且将这些表达式编译到CPU或者GPU中。 功能特性 研究人员可以添加他们所需要的功能。我们避免提前设置过多自上而下的计划,这样容易导致用户难以使用。 一个实现高效科学实验的机器学习工具箱…