由于blog各种垃圾评论太多,而且本人审核评论周期较长,所以懒得管理评论了,就把评论功能关闭,有问题可以直接qq骚扰我

 分类:大数据

Azkaban 任务运行时长监控

Azkaban 任务运行时长监控
1、解决的痛点 各种原因导致的Azkaban任务运行假死,无法正常跑任务的情况。 2、解决方案 通过调用Azkaban API接口,获取project flow的startTime时间,通过程序进行相减,得出的值超过报警阀值进行报警。 API调用示例: 1、获取用户身份的sess...

4年前 (2020-07-19) 4019℃ 25喜欢

impala 实时分析引擎介绍

impala 实时分析引擎介绍
impala的产生背景和应用场景 Impala由cloudera公司主导开发的大数据实时查询分析工具,宣称比原来基于MapReduce的HiveSQL查询速度提升3~90倍,且更加灵活易用。提供类SQL的查询语句,能够查询存储在HDFS、Kudu、HBase(实际生产环境中不用)...

5年前 (2019-08-20) 8975℃ 24喜欢

实时计算——storm原理和运维

实时计算——storm原理和运维
什么是storm Apache Storm是一个分布式实时大数据处理系统。Storm设计用于在容错和水平可扩展方法中处理大量数据。它是一个流数据框架,具有较高的吞吐率和较低的延迟。Storm是无状态的,它通过Apache ZooKeeper 管理分布式环境和集群状态。部署和开发S...

6年前 (2019-05-04) 6312℃ 4喜欢

CDH 20个实战案例

CDH 20个实战案例
CCA介绍 Cloudera Certified Associate(CCA认证)是Cloudera面向初中级 Hadoop技术人员推出的认证考试。由于Cloudera的Hadoop发行版是目前 使用最广泛的版本,Cloudera的认证也因此被广泛承认。能够获得这类 证书对于技术...

6年前 (2019-02-26) 13409℃ 9喜欢

hadoop集群认证和授权

hadoop集群认证和授权
CDH 安全 hadoop的HDFS和mapreduce均缺乏相应的安全机制,比如在HDFS中,用户只要知道某个block的blockID,便可以绕过NameNode直接从DataNode上读取该block,用户可以向任意DataNode上写block;在MapReduce中,用...

6年前 (2019-02-04) 11830℃ 2喜欢

CDH和CM介绍及搭建

CDH和CM介绍及搭建
CDH和CM简介 什么是CDH CDH(Cloudera’s Distribution Including Apache Hadoop)是Hadoop发行版的一种,是一套目前比较完整的、充分测试的Hadoop及其相关项目的发行版。CDH的基础组件均基于apache license...

6年前 (2019-02-04) 45649℃ 35喜欢