![Spark大数据编程实用教程在线阅读](https://wfqqreader-1252317822.image.myqcloud.com/cover/942/36922942/b_36922942.jpg)
会员
Spark大数据编程实用教程
艾叔主编更新时间:2021-03-23 18:10:03
最新章节:参考文献开会员,本书免费读 >
《Spark大数据编程实用教程》是一本讲解Spark基础应用及编程的实用教程,基于Spark2.3版本,内容包括Spark与大数据、构建Spark运行环境、开发一个Spark程序、深入理解Spark程序代码、RDD编程、SparkSQL结构化数据处理、SparkStreaming、StructuredStreaming、SparkR和GraphX。本书总结了Spark学习的关键点;提出了Spark快速学习路线图;提供配套的Spark前置课程学习资源链接,包括虚拟机、Linux和Shell免费高清视频、《零基础快速入门Scala》免费电子书等,帮助零基础读者迅速夯实Spark基础。《Spark大数据编程实用教程》配以大量的示例、源代码和注释,可以帮助读者快速、全面而又深入地掌握Spark编程技能。
品牌:机械工业出版社
上架时间:2020-05-14 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
艾叔主编
主页
同类热门书
最新上架
- 会员
数据分析实践:专业知识和职场技巧
《数据分析实践:专业知识和职场技巧》从初学者的角度出发,讲解了进阶为高级数据分析师所需的知识和技能,其中既包括数据分析岗位的介绍、发展现状及未来趋势,也包括实际工作中各环节的方法策略、实战案例,还包括职场中的困惑解答及面试指导。阅读本书,并基于本书进一步拓展所需要的知识能,可以帮助读者形成一套成系统、可实战的数据分析方法论。计算机19.6万字 - 会员
数据科学技术:文本分析和知识图谱
数据科学的关键技术包括数据存储计算、数据治理、结构化数据分析、语音分析、视觉分析、文本分析和知识图谱等方面。本书的重点是详细介绍文本分析和知识图谱方面的技术。文本分析技术主要包括文本预训练模型、多语种文本分析、文本情感分析、文本机器翻译、文本智能纠错、NL2SQL问答以及ChatGPT大语言模型等。知识图谱技术主要包括知识图谱构建和知识图谱问答等。本书将理论介绍和实践相结合,详细阐述各个技术主题的计算机21.6万字 - 会员
PySpark大数据分析与应用
本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出,理论叙述循序渐进、由浅入深。本书共7章,第1?5章包括PySpark大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、基于PySpark的机器学习库,内容介绍注重理论与实践相结合,通过典型示例计算机10.4万字 - 会员
数据质量实践手册:4步构建高质量数据体系
高质量的数据关乎企业运营、合规、决策和业绩的关键,哈佛商业评论的一项研究发现,企业中只有3%的数据符合质量标准,绝大多数公司都在寻求切实可行的指导来提高数据质量。本书作者基于多年在数据、数据分析和人工智能方面的实践经验,阐述了4步构建高质量数据体系。他提出了高质量数据的四阶段DARS方法(定义、评估、实现、持续)和10个数据质量最佳实践案例,以此来提高业务中的数据质量水平,为业务提供数据价值,保证计算机11.7万字 - 会员
SQL Server从入门到精通(第5版)
《SQLServer从入门到精通(第5版)》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了SQLServer开发所必需的各方面技术。全书分为4篇共19章,内容包括数据库基础、SQLServer数据库环境搭建、创建与管理数据库、操作数据表、SQL基础、SQL函数的使用、SQL数据查询基础、SQL数据高级查询、视图的使用、存储过程、触发器、游标的使用、索引与数据完整性、SQL中计算机14.1万字 - 会员
大数据SQL优化:原理与实践
这是一本站在一线开发人员的视角,从SQL的本质出发,采用理论与实践相结合、案例与分析相结合、作者经验与一线需求相结合的方式,深度解读大数据SQL优化核心技术和解决方案的工具书。本书主要面向大数据初中级技术人员,期望帮大家深度理解大数据SQL优化原理,掌握SQL优化的落地实践方法,从而真正“玩转”大数据SQL优化技术,根据实际问题和需求设计出有针对性的提升SQL性能的解决方案。计算机14万字 - 会员
数字IC设计入门(微课视频版)
本书旨在向广大有志于投身芯片设计行业的人士及正在从事芯片设计的工程师普及芯片设计知识和工作方法,使其更加了解芯片行业的分工与动向。本书共分9个章节,从多角度透视芯片设计,特别是数字芯片设计的流程、工具、设计方法、仿真方法等环节。凭借作者多年业内经验,针对IC新人关心的诸多问题,为其提供了提升个人能力,选择职业方向的具体指导。本书第1章是对IC设计行业的整体概述,并解答了IC新人普遍关心的若干问题。计算机29.9万字 - 会员
剑指大数据:Flink实时数据仓库项目实战(电商版)
本书从需求规划、需求实现到可视化展示等,遵循项目开发的主要流程,全景介绍了电商行业Flink实时数据仓库的搭建过程。在整个项目的搭建过程中,介绍了主要组件的安装部署、需求实现的具体思路、问题的解决方案等,并穿插了大数据和数据仓库相关的理论知识,包括数据仓库的概念介绍、电商业务概述、数据仓库理论介绍和数据仓库建模等。最核心的内容是代码中对Flink的灵活应用,为读者展示了Flink处理数据的多种可能计算机13.1万字 - 会员
分布式数据库基础与应用
本书是一本介绍分布式数据库基础内容与应用的大数据专业类图书,力求培养读者对分布式数据库的应用技能。本书共11章,采用原理+代码实例+综合案例的编写形式,清晰明了地介绍分布式数据库的原理、基础应用、进阶应用及主流工具的使用方法、应用场景,以理实结合为编写要求,让读者能够轻松学习和掌握分布式数据库的内容。本书可以作为高等院校计算机、网络技术等相关专业的教材,也可以作为数据库相关工作的从业人员的参考用书计算机14万字
同类书籍最近更新
- 会员
计算机组成原理与接口技术:基于MIPS架构实验教程(第2版)
本书配合《计算机组成原理与接口技术——基于MIPS架构》一书而编写,特点是以实验为主,在简要介绍基本原理的基础上,详细地阐述了各个实验设计、实现等具体过程。本书实验内容分为三部分:MIPS汇编程序设计、基于FPGA的原型计算机系统设计以及基于IP核的嵌入式计算机系统设计。本书介绍了MIPS模拟器QtSpim、Mars,XilinxFPGA开发套件Vivado、SDK等开发工具的使用,并通过一个个数据库12万字 - 会员
Python数据分析与数据化运营
这是一部从实战角度讲解如何利用Python进行数据分析、挖掘和数据化运营的著作,不仅对数据分析的关键技术和技巧进行了总结,更重要的是对会员、商品、流量、内容4个主题的数据化运营进行了系统讲解。数据库34.8万字 - 会员
工业大数据工程:系统、方法与实践
本书探索工业大数据的工程方法体系,并介绍了其中的关键技术,提出了多领域的工业物理对象建模方法和查询技术。全书共10章,第1章讨论了工业大数据的内涵与特点,并给出了工业大数据工程的三个要素,即数据资源、数据分析和数据应用;第2~4章提出了领域模型驱动的数据资源的建模技术,并给出了工业大系统技术与建设方法;第5、6章讨论了敏捷工业大数据分析与运维方法,并阐述了背后的分析软件技术;第7章讨论了用户驱动的数据库22.6万字 - 会员
数据库查询优化器的艺术:原理解析与SQL性能优化
本书是数据库查询优化领域的里程碑之作,由Oracle公司MySQL全球开发团队、资深专家撰写,作者有10余年数据库内核和查询优化器研究经验。数据库领域泰斗王珊教授亲自作序推荐,PostgreSQL中国社区和中国用户会发起人以及来自Oracle、新浪、网易、华为等企业的数位资深数据库专家联袂推荐。从原理角度深度解读和展示数据库查询优化器的技术细节和全貌;从源码实现角度全方位深入分析MySQL和Pos数据库25.2万字 - 会员
云计算和大数据服务:技术架构、运营管理与智能实践
《云计算和大数据服务——技术架构、运营管理与智能实践》采用理论与实践相结合的形式,系统阐述云计算和大数据服务的具体实现。云计算和大数据服务战略的落地,包括技术构建和运营管理、新兴的人工智能技术的应用,以及组织能力的建设。针对这一目标,全书分为七部分:云计算技术、大数据及数据智能、服务的技术运营、智能运营、安全技术与管理、服务质量管理和组织能力。《云计算和大数据服务——技术架构、运营管理与智能实践》数据库53.3万字 - 会员
PyTorch深度学习实战
虽然很多深度学习工具都使用Python,但PyTorch库是真正具备Python风格的。对于任何了解NumPy和scikit-learn等工具的人来说,上手PyTorch轻而易举。PyTorch在不牺牲高级特性的情况下简化了深度学习,它非常适合构建快速模型,并且可以平稳地从个人应用扩展到企业级应用。由于像苹果、Facebook和摩根大通这样的公司都使用PyTorch,所以当你掌握了PyTorth,数据库25.8万字