该文件说:
enable.auto.commit:卡夫卡源没有犯任何偏移。
因此,我的问题是,在一个工人或分区崩溃/重启的事件:
- startingOffsets设置为最新的,我们怎么不松动的消息?
- startingOffsets设置为最早的,我们怎么不重新处理所有消息?
这似乎是非常重要的。 关于如何处理它的任何指示?
该文件说:
enable.auto.commit:卡夫卡源没有犯任何偏移。
因此,我的问题是,在一个工人或分区崩溃/重启的事件:
这似乎是非常重要的。 关于如何处理它的任何指示?
我也遇到了这个问题。
你就在你的观察在2个选项,即
startingOffsets
设置为latest
startingOffsets
设置为earliest
然而...
有通过添加下面的选项检查点的选项:
.writeStream .<something else> .option("checkpointLocation", "path/to/HDFS/dir") .<something else>
在出现故障的情况下,星火会去通过这个检查站目录中的内容,接受任何新数据之前找回状态。
我发现这个有用的参考上是相同的。
希望这可以帮助!