用Excel进行求解最佳配送方案
技术文章 / 2017-12-11

[尊重原创,转载请注明出处,本文链接  ] 上次分享了如何通过Excel制定最优生产计划,这次,我们继续介绍使用Excel来求解最佳配送方案。 待求解问题 某公司从事饮品生产业务,分别由辽宁、山东、新疆三个不同地区的工厂生产,运往北京、上海、广州、成都4个城市销售。假设 各地区的产能情况: 产地 产能(箱) 辽宁 6000 山东 5000 新疆 12000 各城市的需求情况: 城市 需求量(箱) …

使用Excel的规划求解求得最优生产计划
技术文章 / 2017-12-07

[尊重原创,转载请注明出处,本文链接  ] 最近几年,大数据、机器学习等词语被炒得如火如荼,但是技术是为生产服务的。脱离了实际应用场景谈大数据没有太大的价值。殊不知,其实Excel也可以解决很多数据挖掘问题,了解了如何通过数学工具去解决实际问题,那么使用任何工具(如Python、R、SPSS)都是相同的道理。下面就是通过一个简单的模型来计算最优生产计划问题,弄懂了可以直接应用到实际生产中,无非需要…

用 Python 实现一个大数据搜索引擎
技术文章 / 2017-12-06

搜索是大数据领域里常见的需求。Splunk和ELK分别是该领域在非开源和开源领域里的领导者。本文利用很少的Python代码实现了一个基本的数据搜索功能,试图让大家理解大数据搜索的基本原理。 布隆过滤器 (Bloom Filter) 第一步我们先要实现一个布隆过滤器。 布隆过滤器是大数据领域的一个常见算法,它的目的是过滤掉那些不是目标的元素。也就是说如果一个要搜索的词并不存在与我的数据中,那么它可以…

关于最优化问题的入门
技术文章 / 2017-12-04

1 优化问题分类 优化问题一般可分为两大类:无约束优化问题和约束优化问题,约束优化问题又可分为含等式约束优化问题和含不等式约束优化问题。 无约束优化问题 含等式约束的优化问题 含不等式约束的优化问题 2 求解策略 针对以上三种情形,各有不同的处理策略: 无约束的优化问题:可直接对其求导,并使其为0,这样便能得到最终的最优解; 含等式约束的优化问题:主要通过拉格朗日乘数法将含等式约束的优化问题转换成…

Pylearn2:一个基于Theano的机器学习库
技术文章 / 2017-12-03

Pylearn2是一个基于Theano的机器学习库,它的大部分功能是基于Theano顶层实现的。这意味着用户可以用数学表达式去编写Pylearn2插件(新模型、算法等),Theano不仅会帮助用户优化这些表达式,并且将这些表达式编译到CPU或者GPU中。 功能特性 研究人员可以添加他们所需要的功能。我们避免提前设置过多自上而下的计划,这样容易导致用户难以使用。 一个实现高效科学实验的机器学习工具箱…

Python NLP入门教程
技术文章 / 2017-12-03

目录 什么是NLP? NLP实现 NLP库 安装 NLTK 使用Python Tokenize文本 统计词频 处理停用词 使用NLTK Tokenize文本 非英文Tokenize 同义词处理 反义词处理 词干提取 非英文词干提取 单词变体还原 词干和变体的区别   正文 本文简要介绍Python自然语言处理(NLP),使用Python的NLTK库。NLTK是Python的自然语言处理工…

提升 Python 程序性能的 6 个技巧
技术文章 / 2017-12-01

本文除非特殊指明,”python“都是代表CPython,即C语言实现的标准python,且本文所讨论的是版本为2.7的CPython。另外,本文会不定期更新,如果大家有一些好的想法,请在评论里面留言,我会补充到文章中去。 姊妹篇:《Python内存优化》 姊妹篇:《使用gc、objgraph干掉python内存泄露与循环引用!》 python为什么性能差: 当我们提到一门编程语言的效率时:通常有…

总结自快速机器学习算法基准测试的重要经验
技术文章 / 2017-11-30

根据KDNuggets网站的介绍,增强决策树正支撑着Kaggle机器学习挑战赛中超过半数的胜出解决方案。除了卓越的性能表现之外,这些算法亦拥有现实层面的吸引力——即最大程度降低调整需求。在今天的文章中,我们将评估两款高人气升级包:XGBoost与LightGBM,亦包括其GPU实现方案。如果您觉得文章太长而不想通读,那么我们会将对六套数据集进行测试所得出的结论总结如下: XGBoost与Light…

机器学习的最小可用产品:人工智能应用的敏捷开发
技术文章 / 2017-11-29

编者按:“范式大学”由第四范式发起,致力于成为培养工程师转型为数据科学家的“黄埔军校”。专栏专注于以人工智能解决具体商业问题。在这里你将会看到,企业如何通过可实施的方法完成 AI 转型;个人如何通过最新的科技工具,快速成为能解决问题的机器学习工程师。 本文是大数据杂谈 7 月 6 日社群公开课分享整理,也是第四范式主题月的第一堂公开课内容。 大家好,我是第四范式的联合创始人田枫,很高兴在这里和大家…