Это его распознанный текст, как я понимаю, то, что осталось после ocr. Вы исходный файл гляньте.Это что за поток сознания?
Здесь удалены битмапы, остались только результаты распознавания
То есть удалить сканы (или перенести их на отдельный слой), оставив только распознанный векторный текст, не проблема. Другой вопрос, что результат полностью зависит от результатов распознавания
Последнее редактирование: