Cortana智能与机器学习博客 将人工智能引入商务智能——Azure Machine Learning中的文本分析
技术文章 / 2017-11-28

Azure Machine Learning Studio提供一款瑞士军刀般的出色工具,能够以强大且高效的方式对文本数据集进行操作。举例来说,其中的一套内置模块可应用于语言检测及文本预处理等较低级别任务,用于实现案例标准化、停止词删除、词干提取与词汇化等常见清理步骤。建立在此基础之上的则为更为完整的模块集合,能够通过散列或TF-IF等指标将预处理文本转换为N-gram,同时跳过其中的数字特征。在建…

开源大数据分析平台superset安装与配置
技术文章 / 2017-09-20

Superset最初由Airbnb开发,现已成为Apache旗下的开源项目,源码托管在github之上,由python编写。 目前可以支持Linux和OSX,好像还不支持windows。 首先是安装部署,其实官方文档写得很清楚了(http://superset.apache.org/installation.html#getting-started),这里把个人心得写出来,方便英文不好的朋友参考,…