
会员
Doris实时数仓实战
王春波更新时间:2023-11-02 20:31:59
最新章节:封底开会员,本书免费读 >
这是一本从基本操作、架构设计、进阶使用、运维管理、拓展应用、项目实战等多个维度全面讲解Doris的著作,是资深数据仓库专家兼Doris开源项目贡献者实战经验的总结,得到了ApacheDorisPMC主席、SelectDB创始人兼CEO以及多位ApacheDorisPMC的强烈推荐。通过本书,读者不仅能零基础快速掌握Doris的原理和使用,还能获得搭建离线/在线实时数仓的项目实战经验。全书内容从逻辑上分为四个部分:基础篇(第1-4章):首先介绍了Doris的功能特点、架构设计、应用场景,然后讲解了Doris的编译、安装、部署、建表等基本操作,以及Doris的数据对象和数据模型。进阶篇(第5-7章):从执行原理、用法详解、应用举例3个维度详细讲解了Doris的数据导入、数据查询和查询优化,层层递进。拓展篇(第8-10章):结合目前流行的Flink框架和各种常用外部表讲解了Doris的拓展应用,还讲解了Doris的集群管理。实战篇(第11-14章):首先从具体应用的角度介绍了离线数据仓库和实时数据仓库搭建的痛点和难点,然后用2个综合项目讲解了如何结合Doris实现离线数据仓库和实时数据仓库。
品牌:机械工业出版社
上架时间:2023-04-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
王春波
主页
最新上架
- 会员
数据分析实践:专业知识和职场技巧
《数据分析实践:专业知识和职场技巧》从初学者的角度出发,讲解了进阶为高级数据分析师所需的知识和技能,其中既包括数据分析岗位的介绍、发展现状及未来趋势,也包括实际工作中各环节的方法策略、实战案例,还包括职场中的困惑解答及面试指导。阅读本书,并基于本书进一步拓展所需要的知识能,可以帮助读者形成一套成系统、可实战的数据分析方法论。计算机19.6万字 - 会员
大数据SQL优化:原理与实践
这是一本站在一线开发人员的视角,从SQL的本质出发,采用理论与实践相结合、案例与分析相结合、作者经验与一线需求相结合的方式,深度解读大数据SQL优化核心技术和解决方案的工具书。本书主要面向大数据初中级技术人员,期望帮大家深度理解大数据SQL优化原理,掌握SQL优化的落地实践方法,从而真正“玩转”大数据SQL优化技术,根据实际问题和需求设计出有针对性的提升SQL性能的解决方案。计算机14万字 - 会员
企业级大数据项目实战:用户搜索行为分析系统从0到1
《企业级大数据项目实战:用户搜索行为分析系统从0到1》基于真实业务场景,以项目导向为主线,从0到1全面介绍企业级大数据用户搜索行为分析系统的搭建过程。全书共6章,第1章讲解项目需求与架构设计,详细阐述项目数据流与系统架构;第2章介绍大数据项目开发环境配置,手把手带领读者配置操作系统、Hadoop集群与相关工具,为后续项目实施打下基础;第3~5章逐步实现项目需求,第3章讲解用户行为数据采集模块的开发计算机9万字 - 会员
数据指标体系:构建方法与应用实践
这是一套数据指标体系全流程构建(从规划、框架设计、数据采集加工到应用)方法论与实践指南。它不仅深入浅出地分享了通用的数据指标体系构建策略,还通过多个行业实例展示了具体操作方法。书中从数据采集入手,借助BI工具Superset实践构建过程。本着“一切技术都是为业务服务的”这一宗旨,本书除了包含数据指标体系构建相关内容外,还结合统计学原理及Excel、Python等工具,深入剖析数据指标波动对业务的影计算机12.7万字 - 会员
深入理解InfluxDB:时序数据库详解与实践
时序数据库是一种新型技术,主要用于工业互联网软件建设中。近年来,伴随着物联网技术在智能制造、交通、能源、智慧城市等领域的发展,时序数据库也发展迅速,成为搭建应用的必备数据库之一。《深入理解InfluxDB》从InfluxDB的安装开始,一步步详细介绍InfluxDB的功能及原理,带领读者深入理解以InfluxDB为代表的时序数据库。计算机7.6万字 - 会员
数据库原理及应用实验:基于GaussDB的实现方法
本书是《数据库原理——GaussDB技术及应用》一书配套的辅助教材。全书共分3部分:第一部分为实验指导,共有13个综合实验,每一个实验都是根据教学目标而设计,详细讲述了每一个实验的实验目的、实验任务及实验步骤,从而培养学生掌握关系数据库管理软件技术与应用的技能;第二部分为习题集,是根据主教材各章节内容编写的习题及习题答案,内容广泛,有填空、选择、简答、设计及实验题等多种形式,利求通过对这些习题的训计算机6.9万字 - 会员
Python数据分析与挖掘实战
本书以Python数据分析与挖掘的常用技术与真实案例相结合的方式,深入浅出地介绍Python数据分析与挖掘的重要内容。本书共11章,分为基础篇(第1~5章)和实战篇(第6~11章),基础篇包括数据挖掘基础、Python数据挖掘编程基础、数据探索、数据预处理、数据挖掘算法基础等基础知识;实战篇包括6个案例,分别为信用卡高风险客户识别、餐饮企业菜品关联分析、金融服务机构资金流量预测、O2O优惠券使用预计算机13.6万字 - 会员
数据挖掘竞赛实战:方法与案例
本书围绕数据挖掘竞赛,讲解了各种类型数据挖掘竞赛的解题思路、方法和技巧,并辅以对应的实战案例。全书共11章。第1章介绍数据挖掘竞赛的背景、意义和现状。从第2章开始,介绍了各种不同类型的数据挖掘竞赛包括结构化数据、自然语言处理、计算机视觉(图像)、计算机视觉(视频)、强化学习。每种类型的数据挖掘竞赛包含理论篇和实战篇:理论篇介绍通用的解题流程和关键技术;实战篇选取比较有代表性的赛题,对赛题的优秀方案计算机6.7万字 - 会员
数据分析师手记:数据分析72个核心问题精解
《数据分析师手记:数据分析72个核心问题精解》从底层认知、思维方法、工具技术、项目落地及展望出发,使用问答的形式对数据分析中的72个核心知识点进行讲解,构建了数据分析的知识框架,带领读者认识数据分析背后的奥妙。读者可以用本书作为学习地图,针对具体的方法、技术进行延伸学习。计算机16.8万字
同类书籍最近更新
- 会员
分布式数据服务:事务模型、处理语言、一致性与体系结构
随着物联网、云计算、大数据与人工智能等技术的蓬勃发展,计算服务逐渐从计算密集型向数据密集型(DataIntensive)转变。高性能、高通量的数据服务关键技术成为智慧城市、智能制造、智慧农业等国家重大需求解决方案的核心基础。并行与分布式数据处理的概念启发于上世纪80年代,源自讨论在内存及二级存储极为有限的条件下如何跨越“内存墙”,完成计算任务的优化技术。而今,互联网与私有网络数据指数级增长、数据服数据库15.5万字 - 会员
Sybase数据库在UNIX、Windows上的实施和管理
本书就是用于为大家呈现一个完整的Sybase!本书站在服务器综合系统的角度,以工程实现为出发点,综合解析了SybaseASE的各项构成、运行环境的构造、在UNIX/Linux/Windows平台的环境建设特点。同时,本书也以Sybase的ASE15.5/15.0版为主,兼顾传统的ASE12.5版,全景展现了Sybase在系统构建和运维中的诸项技术,描述了系统可恢复性的实现,以及系统高性能运行数据库24.4万字 - 会员
区块链应用开发指南:业务场景剖析与实战
区块链现在仍然是一个新生事物,就像其他所有新生事物一样,充满了争议。但不可否认,它也给逐渐变得稳定的互联网带来一股新的活力。《区块链应用开发指南》力图为区块链从业人员提供一份完整的开发指南。数据库12.8万字 - 会员
Kubernetes快速进阶与实战
本书精选Kubernetes的硬核知识,帮助读者快速进阶和积累Kubernetes实战经验。本书共8章,主要包括认识Kubernetes,快速构建Kubernetes集群,Kubernetes核心对象使用,Kubernetes容器编排实践,Kubernetes系统运维与故障处理,构建Kubernetes高可用集群,Kubernetes监控与告警(Prometheus+Grafana)和基于Kube数据库8.8万字 - 会员
Learning Software Testing with Test Studio
LearningSoftwareTestingwithTestStudioisapractical,hands-onguidethatwillhelpyougetstartedwithTestStudiotodesignyourautomatedsolutionandtests.Allthroughthebook,thereareb数据库7.5万字 - 会员
达梦数据库运维实战
本书以DM8为对象,系统介绍了DM8数据库的安装和维护,以及达梦数据库主流的两大解决方案:达梦数据守护和DMDSC高可用集群方案,完善了达梦数据库的运维体系。本书从达梦数据库的实际使用和维护角度出发,演示了基于中标麒麟Linux平台的大量实战操作。通过本书的学习,读者可以掌握达梦数据库的安装和基础操作,如用户、表空间、普通表、分区表、索引、参数、统计信息的管理操作;也可以系统地掌握达梦数据库的备份数据库6.2万字