我如何在python中不断从屏幕的特定部分得到一个单词

我正在尝试制作一个程序,该程序从屏幕的特定部分获取图像,然后将其转换为文本。我知道我应该使用openCV和tesseract转换为文本,但是我不明白如何不断从屏幕上输入特定的图像。图像大约每1-2秒变化一次。