在生产环境使用Kafka构建和部署大规模机器学习
技术文章 / 2017-11-26

使用Apache Kafka在生产环境构建大规模机器学习 智能实时应用为所有行业带来了革命性变化。机器学习及其分支深度学习正蓬勃发展,因为机器学习让计算机能够在无人指引的情况下挖掘深藏的洞见。这种能力正是多种领域所需要的,如非结构化数据分析、图像识别、语音识别和智能决策,这完全不同于传统的编程方式(如Java、.NET或Python)。 机器学习并非新生事物,大数据集的出现和处理能力的进步让每一个…

LinkedIn开源流处理器Samza的应用场景、优势、新特性与未来规划
技术文章 / 2017-10-26

Samza是LinkedIn开源的一款流处理器,本文介绍了Samza在LinkedIn公司的应用情况,Samza在流处理方面的优势、新特性以及下一步的规划。 LinkedIn使用Samza提升实时用户体验 中央流量控制:在LinkedIn,发送给用户的所有邮件都会经由中央Email分发Samza任务处理,该任务会根据特定的策略和窗口标准将同一用户的所有邮件进行聚合,最终向用户发送一个汇总的Emai…