查找两个PDF中的文本重叠

我有两个PDF,我想查找两个文件之间的文本重叠。重叠表示工具应指示两个文件中的至少四个后续单词是否一致。 Ubuntu有这样的工具吗?我看到了diffpdf,但是该工具似乎可以发现两个pdf之间的差异很小。我正在寻找类似于a窃工具的东西。例如,该工具应该能够在pdf 1的第1页上找到文本重叠,而在pdf 2的第10页上找到文本短语。

Ubuntu有这样的东西吗?

评论