西门飞冰的文章

（6）Flink SQL on k8s 实现

简介我们在实际使用flink的过程中，不仅使用java开发flink作业，同时也会直接使用flink SQL，通过编写SQL的方式，来实现flink作业。本文就基于Flink 官方提供的 Kubernetes Operator，来实现flink sql在k8s上的运行。程序功...

2年前 (2023-05-29) 2144℃ 2喜欢

Flink HistoryServer用途 HistoryServer可以在Flink 作业终止运行（Flink集群关闭）之后，还可以查询已完成作业的统计信息。此外，它对外提供了 REST API，它接受 HTTP 请求并使用 JSON 数据进行响应。Flink 任务停止后，Jo...

2年前 (2023-05-29) 2028℃ 4喜欢

简介无论是我们自己开发的系统，还是各种中间件，高可用部署可以避免单点故障，是生产运行的必备要求。对于flink作业也一样，我们开发好的flink 作业，部署到生产环境，也需要高可用的方式来运行。 Flink的高可用，指的就是job manager的高可用，默认情况下，每个 Fl...

2年前 (2023-05-29) 6143℃ 2喜欢

简介大家都知道，Flink 是一个有状态的分布式流式计算引擎，flink 中的每个function或者是operator都可以是有状态的，为了使得状态可以容错，flink引入了checkpoint机制。checkpoint使得flink能够恢复作业的状态和位置，从而为作业提供与...

2年前 (2023-05-29) 2535℃ 3喜欢

简介之前部署了flink operator，并将spark 作业提交到了k8s之上，但是也仅仅达到了能用的程度，距离生产落地还有一些内容需要调整。 Flink 作业日志持久化当flink运行出错的时候，或者我们要分析flink运行状态的时候，运行日志是我们排查问题的重要依据。...

2年前 (2023-05-29) 111℃ 6喜欢

简介 Flink Kubernetes Operator是一个用于在Kubernetes集群上部署、管理和自动化运行Apache Flink应用程序的开源项目。它提供了一种简单、可靠且可扩展的方式来部署和管理Flink作业，同时实现高可用性和容错性。 Flink Kubernet...

2年前 (2023-05-29) 2282℃ 2喜欢

前言在JDK 19中提供了一个非常重要的新特性就是虚拟线程，虚拟线程换成go语言就是对应的协程为什么需要虚拟线程为什么要虚拟线程，它到底解决了什么问题？这就要涉及到标准的普通线程了要知道在我们操作系统层面上，要进行高并发的程序处理，都要创建一个一个普通的线程，而这个线...

2年前 (2023-05-17) 6706℃ 0喜欢

问题描述 K8S 集群，新安装了nginx服务器，但是访问80端口出来的服务不对，关闭nginx后，仍然可以访问服务器的80端口，但是本地80端口并没有任何服务监听。因为是K8S节点，所以怀疑是K8S上配置了转发规则导致。解决办法 1、查看端口转发规则：K8S服务器上可能存在端...

2年前 (2023-05-17) 1620℃ 1喜欢

简介 Iceberg 的优势有以下几点： 1、增量数据更新：Iceberg 可以支持增量数据更新，而不是全量数据覆盖，从而减少了数据更新的时间和成本。 2、事务管理：Iceberg 支持事务管理，可以确保数据的一致性和可靠性。 3、版本管理：Iceberg 支持版本管理，可以方便...

2年前 (2023-04-28) 5003℃ 1喜欢

简介 nifi 是一个数据同步的框架，像是flume和datax可以完成的操作，nifi都可以完成，本文展示了两个nifi的实际案例，来学习nifi的使用。案例一：使用nifi离线同步mysql数据到hdfs，模拟datax的常用场景案例二：使用nifi实时监控Kafka数据...

2年前 (2023-04-27) 1489℃ 1喜欢