大数据时代的到来,给互联网又增加了好多的技术要求,现在的工程师不懂点大数据的知识都觉得不完美,好多企业也是想要大数据开发方面的人才。今天千锋小编给大家分享的是大数据工程师的技能树,让你对大数据工程师有一个基本的了解。
1. 什么是大数据工程师
数据工程师这个概念其实很模糊,不同的人和公司对它赋予的含义也区别很大,在这里,我们大概聊一下一般意义上的大数据工程师在工作中会做什么?
集群运维:安装、测试、运维各种大数据组件
数据开发:细分一点的话会有ETL工程师、数据仓库工程师等
数据系统开发:偏重Web系统开发,比如报表系统、**系统等
这里面有很多内容其实是十分重合的,下面大致聊一下每一块内容大致需要学什么,以及侧重点。
2. 集群运维
大数据工程师,基本上是离不开集群搭建,比如hadoop、Spark、Kafka,不要指望有专门的运维帮你搞定,新组件的引入一般都要自己来动手的。
因此这就要求数据工程师了解各种大数据的组件。
由于要自己的安装各种开源的组件,就要求数据工程师要具备的能力: Linux 。要对Linux比较熟悉,能各种自己折腾着玩。
由于现在的大数据生态系统基本上是 JVM 系的,因此在语言上,就不要犹豫了,JVM系的Java和Scala基本上跑不掉,Java基本上要学的很深,Scala就看情况了。
3. ETL
ETL 在大数据领域主要体现在各种数据流的处理。这一块一方面体现在对一些组件的了解上,比如Sqoop、Flume、Kafka、Spark、MapReduce;另一方面就是编程语言的需要,Java、Shell和Sql是基本功。
4. 系统开发
我们大部分的价值**后都会由系统来体现,比如报表系统和**系统。因此就要求有一定的系统开发能力,**常用的就是 Java Web 这一套了,当然Python也是挺方便的。
需要注意的是,一般数据开发跑不掉的就是各种提数据的需求,很多是临时和定制的需求,这种情况下, Sql 就跑不掉了,老老实实学一下Sql很必要。
大数据工程师相对于其他it技术人而言,是比较全能型人才,需要掌握的知识技术也比较多,未来的路还很长,需要陪伴的时候,千锋风里雨里会一直等你!
千锋教育:http://www.mobiletrain.org/
千锋重庆校区:http://cq.mobiletrain.org/
重庆校区地址:重庆市高新区科园一路2号大西洋国际12-1
培训咨询专线:023-68883009
咨 询 QQ : 1660794050
面授课程:全栈HTML5+培训、全链路设计培训、PHP全栈+服务器集群培训、JavaEE+分布式开发培训、大数据+人工智能培训、 Unity游戏开发培训、Python培训、云计算+Python运维培训、全栈软件测试培训、Android培训、iOS培训