不搞你就Out了!数据专家告诉你如何在企业中整合机器学习
技术文章 / 2017-12-24

世界经历过工业革命,现在我们正处于数字革命的时代。机器学习、人工智能和大数据分析是当今世界的现实。 我最近有机会与Talend副总裁CiaranDynes以及Datalytyx主管JustinMullen交谈。Talend是一家软件集成供应商,主要为企业提供大数据解决方案,而Datalytyx是大型数据工程、数据分析和云解决方案业务的领先提供商,其提供的服务能够让企业运营更快、更有效、更有利润。 …

在生产环境使用Kafka构建和部署大规模机器学习
技术文章 / 2017-12-22

使用Apache Kafka在生产环境构建大规模机器学习 智能实时应用为所有行业带来了革命性变化。机器学习及其分支深度学习正蓬勃发展,因为机器学习让计算机能够在无人指引的情况下挖掘深藏的洞见。这种能力正是多种领域所需要的,如非结构化数据分析、图像识别、语音识别和智能决策,这完全不同于传统的编程方式(如Java、.NET或Python)。 机器学习并非新生事物,大数据集的出现和处理能力的进步让每一个…

Pylearn2:一个基于Theano的机器学习库
技术文章 / 2017-12-03

Pylearn2是一个基于Theano的机器学习库,它的大部分功能是基于Theano顶层实现的。这意味着用户可以用数学表达式去编写Pylearn2插件(新模型、算法等),Theano不仅会帮助用户优化这些表达式,并且将这些表达式编译到CPU或者GPU中。 功能特性 研究人员可以添加他们所需要的功能。我们避免提前设置过多自上而下的计划,这样容易导致用户难以使用。 一个实现高效科学实验的机器学习工具箱…

总结自快速机器学习算法基准测试的重要经验
技术文章 / 2017-11-30

根据KDNuggets网站的介绍,增强决策树正支撑着Kaggle机器学习挑战赛中超过半数的胜出解决方案。除了卓越的性能表现之外,这些算法亦拥有现实层面的吸引力——即最大程度降低调整需求。在今天的文章中,我们将评估两款高人气升级包:XGBoost与LightGBM,亦包括其GPU实现方案。如果您觉得文章太长而不想通读,那么我们会将对六套数据集进行测试所得出的结论总结如下: XGBoost与Light…

机器学习的最小可用产品:人工智能应用的敏捷开发
技术文章 / 2017-11-29

编者按:“范式大学”由第四范式发起,致力于成为培养工程师转型为数据科学家的“黄埔军校”。专栏专注于以人工智能解决具体商业问题。在这里你将会看到,企业如何通过可实施的方法完成 AI 转型;个人如何通过最新的科技工具,快速成为能解决问题的机器学习工程师。 本文是大数据杂谈 7 月 6 日社群公开课分享整理,也是第四范式主题月的第一堂公开课内容。 大家好,我是第四范式的联合创始人田枫,很高兴在这里和大家…

Cortana智能与机器学习博客 将人工智能引入商务智能——Azure Machine Learning中的文本分析
技术文章 / 2017-11-28

Azure Machine Learning Studio提供一款瑞士军刀般的出色工具,能够以强大且高效的方式对文本数据集进行操作。举例来说,其中的一套内置模块可应用于语言检测及文本预处理等较低级别任务,用于实现案例标准化、停止词删除、词干提取与词汇化等常见清理步骤。建立在此基础之上的则为更为完整的模块集合,能够通过散列或TF-IF等指标将预处理文本转换为N-gram,同时跳过其中的数字特征。在建…

iOS 11:人人可体验的机器学习
技术文章 / 2017-11-26

WWDC 2017向我们传达了这样的一个信号:苹果正在把机器学习带到移动设备上,并且希望开发者们能够轻松地加入到新的平台。 去年,苹果发布了Metal CNN和BNNS框架,用于创建基本的卷积神经网络。今年,Metal增加了很多新的特性,包括一个新的计算机视觉框架,以及Core ML——用于将机器学习模型集成到应用程序里。 在这篇文章里,我会分享并与你们一起体验iOS 11和macOS 10.13…

数据虚拟化:为AI与机器学习实现数据解锁
技术文章 / 2017-11-26

出于可靠性、准确性以及性能表现等方面的考量,AI与机器学习技术在很大程度上皆须依赖于大型设备。这是因为数据池越大,训练模型的质量也就越高。正因为如此,大数据平台才必须能够高效处理各类不同数据流与系统,且不对具体数据结构(或者缺少清晰结构)、数据速度或者数据量作出限定。 然而,这项任务实在是说来容易做来难。 如今,每一套大数据平台都面临着以下系统性挑战: 计算/存储重叠:从传统角度讲,计算与存储两类…

在生产环境使用Kafka构建和部署大规模机器学习
技术文章 / 2017-11-26

使用Apache Kafka在生产环境构建大规模机器学习 智能实时应用为所有行业带来了革命性变化。机器学习及其分支深度学习正蓬勃发展,因为机器学习让计算机能够在无人指引的情况下挖掘深藏的洞见。这种能力正是多种领域所需要的,如非结构化数据分析、图像识别、语音识别和智能决策,这完全不同于传统的编程方式(如Java、.NET或Python)。 机器学习并非新生事物,大数据集的出现和处理能力的进步让每一个…