本书结合计算机相关专业大数据采集与分析方向课程体系、企业大数据采集与分析岗位能力模型和相关课程标准,以实践能力培养为导向,遵循企业软件工程标准和技术,针对Anaconda+PyCharm开发环境、requests库、re模块、lxml库、BeautifulSoup库、Selenium、Scrapy框架、文件和MySQL数据库存储等重要大数据的采集与分析知识,结合实际案例和应用环境进行分析和设计,并对每个重要知识单元进行详细的实现,使读者能够真正掌握这些知识在实际场景中的应用。本书共有7个项目,项目1至项目6采用项目案例进行知识单元训练,项目7用一个求职招聘网站项目贯穿大数据采集与分析核心知识,完整训练核心知识单元在企业真实项目中的应用。本书涉及的示例和项目代码均在Anaconda和PyCharm开发环境中运行通过。
本书适合作为“大数据采集与分析”课程的教材,也可作为对大数据采集与分析感兴趣的学习者的指导用书。