博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
大数据平台开发:大数据系统架构模块解析
阅读量:4074 次
发布时间:2019-05-25

本文共 839 字,大约阅读时间需要 2 分钟。

企业要开展大数据相关业务,首先就需要基于自身的需求,来设计搭建数据系统平台。而大数据系统平台的搭建,需要基于实际需求,来进行系统架构规划。今天我们就从大数据平台开发的角度,来对大数据系统架构模块做一个简单的介绍。

大数据系统架构模块

在实际的业务场景当中,每个公司的需求是不一样的,因此大数据平台开发需要选择适合自己的技术框架,在实际工作当中,这部分工作往往有兼具经验和实力的大数据工程师或者大数据架构师来完成。

通常来说,一个大数据系统架构通用的模块包括——

大数据系统架构模块

数据收集模块:主要负责收集各种数据源的数据,包括日志文件、网络请求、数据库、消息队列等,并将这些数据转换为文件或者消息向后传递。

数据转存模块:主要负责将数据定时传递到分布式存储或者实时传递给下游的数据处理程序。

ETL模块:主要负责数据的清洗、格式和内容的处理和转换、数据分级分拣、加载至数据仓库等。

数据仓库模块:这是整个架构的核心,数据仓库是数据有组织的集中存储的地方,负责数据的存取和管理。

元数据管理模块:主要负责记录和约束数据仓库中数据的含义和格式,控制着数据的生命周期和数据质量。

分析引擎模块:数据分析师交互最多的模块,主要负责执行各种分析语句或代码,完成各种分析任务。

作业管理与调度模块:负责分析作业的管理和定时调度,包括作业的增删改查、查看修改历史、设置调度定时和执行引擎等。

资源分配与调度模块:主要负责在多作业同时运行的场景下,有效协调和分配集群的资源,使资源利用率最大化。

当然,这些模块并不一定每个企业的架构都是如此,始终还是需要基于实际的需求来进行技术选型。这就要求大数据工程师/架构师们,对主流的技术框架要烂熟于心,能不能实现、怎么实现、实现成本几何,做到心中有数,能够结合实际需求来合理地规划解决方案。

大数据系统架构模块

关于大数据平台开发,大数据系统架构模块,以上就为大家做了一个简单的介绍了。大数据系统架构工作,对专业技术的深度和广度,以及项目实操经验,都有相应的要求,大数据架构师,也是做开发方向的高级技术岗位。

转载地址:http://glkni.baihongyu.com/

你可能感兴趣的文章
.net强制退出主窗口的方法——Application.Exit()方法和Environment.Exit(0)方法
查看>>
c# 如何调用win8自带的屏幕键盘(非osk.exe)
查看>>
build/envsetup.sh 简介
查看>>
Android framework中修改或者添加资源无变化或编译不通过问题详解
查看>>
linux怎么切换到root里面?
查看>>
linux串口操作及设置详解
查看>>
安装alien,DEB与RPM互换
查看>>
编译Android4.0源码时常见错误及解决办法
查看>>
Android 源码编译make的错误处理
查看>>
linux环境下C语言中sleep的问题
查看>>
ubuntu 12.04 安装 GMA3650驱动
查看>>
新版本的linux如何生成xorg.conf
查看>>
xorg.conf的编写
查看>>
启用SELinux时遇到的问题
查看>>
virbr0 虚拟网卡卸载方法
查看>>
No devices detected. Fatal server error: no screens found
查看>>
新版本的linux如何生成xorg.conf
查看>>
virbr0 虚拟网卡卸载方法
查看>>
Centos 6.0_x86-64 终于成功安装官方显卡驱动
查看>>
Linux基础教程:CentOS卸载KDE桌面
查看>>