flink

概念

1.阐述 Flink 如何处理反压,相比 Storm,Spark Streaming 提供的反压机制,描述其实现有什么不同?

2.阐述流处理引擎提供的三种数据处理语义,解释 Flink Checkpoint 机制如何保证 Flink 程序结果的 Exactly-Once 语义,描述如何通过两阶段提交协议提供端到端的 Exactly-Once 保证?结合 Kafka 如何构建端到端的 Exactly-Once 处理?

3.阐述 Flink 提供的容错机制,解释分布式快照 Chandy Lamport 算法逻辑,剖析 Flink Checkpoint 具体实现流程?

4.如何处理 Flink 作业频繁重启问题?

5.如何优化大状态的 Flink 作业?

6.如何排查 Flink Checkpoint 超时问题?

7.如何处理 Flink 作业中的数据倾斜问题?

8.Flink 反压机制,如何排查反压瓶颈在哪,及如何处理反压问题?

9.哪种 join 可以满足单个流断流的时候仍然能够保证正确的 join 到数据?

10.watermark 是怎么生成和传递的?

参考文档

https://mp.weixin.qq.com/s/Nf4iV_sNitOMQkw7PGgvOQ
https://ververica.cn/developers/special-issue/
https://files.alicdn.com/tpsservice/aeec17aa6ab8d7d03bff2a1f7463f528.pdf

打赏
  • 版权声明: 本博客所有文章除特别声明外,均采用 Apache License 2.0 许可协议。转载请注明出处!
  • © 2015-2020 Andrew
  • Powered by Hexo Theme Ayer
  • PV: UV:

请我喝杯咖啡吧~

支付宝
微信