实时捕获图像并将其转换为文本-性能问题

我正在尝试创建一个C#程序,该程序捕获屏幕的一部分并将其转换为文本。 问题在于此过程大约需要1-3秒。问题是:是否可以减少处理时间,或者我应该更改语言(如果可以),选择哪种语言?每秒大约2次比较理想。抱歉,如果这是一个菜鸟问题,我只是做了很多研究而没有得到很好的结果...