\
\
内容简介
\
\ \
\
本书由基础知识、安装与部署、研发与维护、进阶知识、企业应用5个模块构成,并细分为20个章节,其中“基础知识”6章、“安装与部署”4章、“研发与维护”4章、“进阶知识”5章、“企业应用”1章,分别介绍了Storm的基本原理、Topology组件、Spout组件、Bolt组件、ZooKeeper集群、Storm的安装与配置、实战环节等内容,包括理论基础、环境搭建、研发准备、企业应用等。
本书理论联系实际,通过大量实例分析,让读者在较短的时间内掌握Storm的使用,搭建并研发出自己的基于Storm的大数据处理平台。
本书适合所有大数据处理、实时流数据处理、Storm的开发者或爱好者,也适合高等院校和培训学校相关专业的师生参考使用。
\
\
\
\\
\
第 5 章
? Spout详解 ?
Spout是Storm数据流的入口。在这一章,将学习Storm数据流的入口点——Spout。通过本章,应该掌握Storm获取数据的方式和方法,了解常用的Spout,学会如何编写Spout类。
5.1 可靠的与不可靠的消息
设计拓扑时,一件很重要的事情是要考虑消息的可靠性。如果消息不能被处理而丢失是很严重的问题,我们需要决定如何处理丢失的消息,如何与拓扑作为一个整体处理。例如,处理银行存款的时候,事务一致性是......\\ \ \\ \ \
\
\\
\
前 言
Storm是一个免费开源的分布式实时计算系统。Storm能够轻松可靠地处理无界的数据流,就像Hadoop对数据进行批处理;但是Storm能持续运作下去,并且Storm的使用十分简单,开发人员可以使用任何编程语言对它进行操作,得到满意的结果。
本书以Apache Storm官方网站XX的Release版本Storm 0.10.0进行讲解,从零开始,使读者在较短的时间内系统掌握Storm的理论基础,面向Linux平台搭建与研发自己基于Storm的大数据处理平台。全书分为5个模块,共20章内容,其中“基础知识”6章、“安装与部署”4章、“研发与维护”4章、“进阶知识”5章、“企业应用”1章,分别介绍了Storm的基本原理、Topology组件、Spout组件、Bolt组件、Storm的安装与配置、ZooKeeper集群、实战环节等......\\ \ \