Pylearn2:一个基于Theano的机器学习库
技术文章 / 2017-12-03

Pylearn2是一个基于Theano的机器学习库,它的大部分功能是基于Theano顶层实现的。这意味着用户可以用数学表达式去编写Pylearn2插件(新模型、算法等),Theano不仅会帮助用户优化这些表达式,并且将这些表达式编译到CPU或者GPU中。 功能特性 研究人员可以添加他们所需要的功能。我们避免提前设置过多自上而下的计划,这样容易导致用户难以使用。 一个实现高效科学实验的机器学习工具箱…

总结自快速机器学习算法基准测试的重要经验
技术文章 / 2017-11-30

根据KDNuggets网站的介绍,增强决策树正支撑着Kaggle机器学习挑战赛中超过半数的胜出解决方案。除了卓越的性能表现之外,这些算法亦拥有现实层面的吸引力——即最大程度降低调整需求。在今天的文章中,我们将评估两款高人气升级包:XGBoost与LightGBM,亦包括其GPU实现方案。如果您觉得文章太长而不想通读,那么我们会将对六套数据集进行测试所得出的结论总结如下: XGBoost与Light…

机器学习的最小可用产品:人工智能应用的敏捷开发
技术文章 / 2017-11-29

编者按:“范式大学”由第四范式发起,致力于成为培养工程师转型为数据科学家的“黄埔军校”。专栏专注于以人工智能解决具体商业问题。在这里你将会看到,企业如何通过可实施的方法完成 AI 转型;个人如何通过最新的科技工具,快速成为能解决问题的机器学习工程师。 本文是大数据杂谈 7 月 6 日社群公开课分享整理,也是第四范式主题月的第一堂公开课内容。 大家好,我是第四范式的联合创始人田枫,很高兴在这里和大家…

Cortana智能与机器学习博客 将人工智能引入商务智能——Azure Machine Learning中的文本分析
技术文章 / 2017-11-28

Azure Machine Learning Studio提供一款瑞士军刀般的出色工具,能够以强大且高效的方式对文本数据集进行操作。举例来说,其中的一套内置模块可应用于语言检测及文本预处理等较低级别任务,用于实现案例标准化、停止词删除、词干提取与词汇化等常见清理步骤。建立在此基础之上的则为更为完整的模块集合,能够通过散列或TF-IF等指标将预处理文本转换为N-gram,同时跳过其中的数字特征。在建…

iOS 11:人人可体验的机器学习
技术文章 / 2017-11-26

WWDC 2017向我们传达了这样的一个信号:苹果正在把机器学习带到移动设备上,并且希望开发者们能够轻松地加入到新的平台。 去年,苹果发布了Metal CNN和BNNS框架,用于创建基本的卷积神经网络。今年,Metal增加了很多新的特性,包括一个新的计算机视觉框架,以及Core ML——用于将机器学习模型集成到应用程序里。 在这篇文章里,我会分享并与你们一起体验iOS 11和macOS 10.13…

数据虚拟化:为AI与机器学习实现数据解锁
技术文章 / 2017-11-26

出于可靠性、准确性以及性能表现等方面的考量,AI与机器学习技术在很大程度上皆须依赖于大型设备。这是因为数据池越大,训练模型的质量也就越高。正因为如此,大数据平台才必须能够高效处理各类不同数据流与系统,且不对具体数据结构(或者缺少清晰结构)、数据速度或者数据量作出限定。 然而,这项任务实在是说来容易做来难。 如今,每一套大数据平台都面临着以下系统性挑战: 计算/存储重叠:从传统角度讲,计算与存储两类…

在生产环境使用Kafka构建和部署大规模机器学习
技术文章 / 2017-11-26

使用Apache Kafka在生产环境构建大规模机器学习 智能实时应用为所有行业带来了革命性变化。机器学习及其分支深度学习正蓬勃发展,因为机器学习让计算机能够在无人指引的情况下挖掘深藏的洞见。这种能力正是多种领域所需要的,如非结构化数据分析、图像识别、语音识别和智能决策,这完全不同于传统的编程方式(如Java、.NET或Python)。 机器学习并非新生事物,大数据集的出现和处理能力的进步让每一个…

如何像专业人士一样挖掘大数据?
技术文章 / 2017-11-26

机器学习可以帮助企业做出更好的抉择。本文分析了使用机器学习的八种方法,有助于企业最大限度地提高成功几率。 图片来自网络 髋关节置换手术需要多长时间? 这对医院来说并不是学术问题。2015年,医院约有360亿美元的无偿保健费用,其中大部分来自患者未付的账单。 这个问题的一个解决方案是限制与手术相关的成本,但是如何才能达成呢?答案是机器学习。医院如今利用预测分析学来预测手术的平均时间和潜在问题,如髋关…

使用 Python 在 Linux 上实现一键回归测试
技术文章 / 2017-11-15

从代码库迁出代码 —- pexpect 的使用 测试人员从代码库(例如 CVS )迁出代码的过程中,需要手动输入访问密码,而 Python 提供了 Pexpect 模块则能够将手动输入密码这一过程自动化。当然 Pexpect 也可以用来和 ssh、ftp、passwd、telnet 等命令行进行自动化交互。这里我们以 CVS 为例展示如何利用 Pexpect 从代码库迁出代码。 清单 1. 用 p…

Python 最火,R 极具潜力:2017 机器学习调查报告
技术文章 / 2017-11-14

数据平台 Kaggle 近日发布了 2017 机器学习及数据科学调查报告,这也是 Kaggle 首次进行全行业调查。调查共收到超过 16000 份回复,受访内容包括最受欢迎的编程语言、不同国家数据科学家的平均年龄、不同国家的平均年薪等。 点此查阅完整报告 下面主要看看工具使用方面的结果。请注意,该报告包含多个国家的数据,可能存在收集不够全面的情况,仅供参考。 年龄 从全球范围来看,本次调查对象的平…