Cortana智能与机器学习博客 将人工智能引入商务智能——Azure Machine Learning中的文本分析
技术文章 / 2017-11-28

Azure Machine Learning Studio提供一款瑞士军刀般的出色工具,能够以强大且高效的方式对文本数据集进行操作。举例来说,其中的一套内置模块可应用于语言检测及文本预处理等较低级别任务,用于实现案例标准化、停止词删除、词干提取与词汇化等常见清理步骤。建立在此基础之上的则为更为完整的模块集合,能够通过散列或TF-IF等指标将预处理文本转换为N-gram,同时跳过其中的数字特征。在建…

产品经理必须掌握的数据分析方法
数据展现 / 2017-11-02

作者 | 陈明,GrowingIO 联合创始人 & 运营副总裁。毕业于斯坦福大学,先后就职于 eBay、LinkedIn 数据分析部门,有丰富的商务分析经验。 随着人口和流量红利的下降,互联网行业必然会朝着精益化运营的方向发展。数据分析在很多互联网人的工作中越发显得重要,而对于产品经理来说,更是如此。 本文将为产品经理介绍数据分析的基本思路,并基于此,衍生出 2 个常见方法和 7 个应用手…

开源大数据分析平台superset安装与配置
技术文章 / 2017-09-20

Superset最初由Airbnb开发,现已成为Apache旗下的开源项目,源码托管在github之上,由python编写。 目前可以支持Linux和OSX,好像还不支持windows。 首先是安装部署,其实官方文档写得很清楚了(http://superset.apache.org/installation.html#getting-started),这里把个人心得写出来,方便英文不好的朋友参考,…