书籍信息

  • 书名:大数据架构商业之路
  • 作者:黄申
  • 出版社: 机械工业出版社
  • 出版日期:2016-5-1
  • 格式:mobi
  • 文件大小:21880.94 KB
  • 评分:8

内容简介

目前大数据技术已经日趋成熟,但是业界发现与大数据相关的产品设计和研发仍然非常困难,技术、产品和商业的结合度还远远不够。这主要是因为大数据涉及范围广、技术含量高、更新换代快,门槛也比其他大多数IT行业更高。人们要么使用昂贵的商业解决方案,要么花费巨大的精力摸索。本书通过一个虚拟的互联网O2O创业故事,来逐步展开介绍创业各个阶段可能遇到的大数据课题、业务需求,以及相对应的技术方案,甚至是实践解析;让读者身临其境,一起来探寻大数据的奥秘。书中会覆盖较广泛的技术点,并提供相应的背景知识介绍,对于想进一步深入研究细节的读者,也可轻松获得继续阅读的方向和指导性建议。

书籍大纲

推荐序一推荐序二前  言第1章 抉择 1第2章 数据收集 42.1 互联网数据收集 42.1.1 网络爬虫 52.1.2 Apache Nutch简介 112.1.3 Heritrix简介 142.2 内部数据收集 152.2.1 Apache Flume简介 172.2.2 Facebook Scribe和Logstash 212.3 本章心得 212.4 参考资料 22第3章 数据存储 233.1 持久化存储 233.1.1 Hadoop和HDFS 253.1.2 HBase简介 283.1.3 MongoDB 353.2 非持久化存储 373.2.1 缓存和散列 373.2.2 Memcached和Berkeley DB简介 413.2.3 Redis简介 413.3 本章心得 443.4 参考资料 44第4章 数据处理 464.1 离线批量处理 464.1.1 Hadoop的MapReduce 474.1.2 Spark简介 524.1.3 Hive简介 534.1.4 Pig、Impala和Spark SQL 564.2 提升及时性:消息机制 584.2.1 ActiveMQ简介 604.2.2 Kafka简介 614.3 在线实时处理 634.3.1 Storm简介 634.3.2 Spark Streaming简介 664.4 本章心得 664.5 参考资料 67第5章 信息检索 695.1 基本理念 705.2 相关性 705.2.1 布尔模型 705.2.2 基于排序的布尔模型 715.2.3 向量空间模型 745.2.4 语言模型 755.3 及时性 775.4 与数据库查询的对比 815.5 搜索引擎 825.5.1 Web搜索中的链接分析 835.5.2 电子商务中的商品排序 865.5.3 多因素和基于学习的排序 885.5.4 系统框架 895.5.5 Lucene简介 935.5.6 Solr简介 985.5.7 Elasticsearch简介 1045.6 推荐系统 1085.6.1 推荐的核心要素 1095.6.2 推荐系统的分类 1105.6.3 混合模型 1155.6.4 系统架构 1165.6.5 Mahout 1165.7 在线广告 1195.8 本章心得 1275.9 参考资料 128第6章 数据挖掘 1306.1 基本理念 1316.2 数据的表示和预处理 1336.3 机器学习算法 1366.4 挖掘工具 1576.5 本章心得 1656.6 参考资料 165第7章 效能评估 1677.1 效果评估 1687.2 性能评估 1907.3 本章心得 2027.4 参考资料 202第8章 大数据技术全景 204第9章 商品太多啦!需要搜索引擎 2079.1 业务需求 2079.2 产品设计和技术选型 2089.3 实现方案 211第10章 能否更主动?还需要推荐引擎 22310.1 业务需求 22310.2 产品设计和技术选型 22510.3 实现方案 230第11章 这样做的效果如何 24111.1 业务需求 24111.2 产品设计和技术选型 24211.3 实现方案 243第12章 这个搜索有点逊 25812.1 业务需求:还要搜得更多 25812.2 “还要搜得更多”:产品设计和技术选型 25912.3 “还要搜得更多”的方案实现 26112.4 业务需求:还要搜得更准 26512.5 “还要搜得更准”:产品设计和技术选型 26612.6 “还要搜得更准”的方案实现 27112.7 业务需求:还要更快 27312.8 还要“变”得更快:产品设计和技术选型 27412.9 还要“搜”得更快:产品设计和技术选型 27512.10 业务需求:给点提示吧 28012.11 给点提示吧:产品设计和技术选型 282第13章 支持更高效的运营 28713.1 业务需求:互联网时代的CRM 28713.2 互联网时代的CRM:产品设计和技术选型 28813.3 业务需求:抓住捣蛋鬼 29113.4 抓住捣蛋鬼:产品设计和技术选型 29213.5 业务需求:销售之战 29513.6 销售之战:产品设计和技术选型 296后记 299

下载地址

下载大数据架构商业之路电子书