Sersey, Протестировал. Результаты не впечатлили. (PDF-файлы для тестов - https://disk.yandex.ru/d/PbyjMm4loWm5xA )
Python:
Извлекает таблицы из 2–5% PDF-файлов.
Не определяет таблицы, которые расположены внутри текста и в многостраничных PDF.
Хорошо определяет если таблица только одна на странице и в документе PDF можно выделить и скопировать текст.
VBJScript:
Находит и распознаёт таблицы в 80–90 % PDF-файлов.
Хорошо распознаёт таблицы в многостраничных и в отсканированных документах.
Главный недостаток – на компьютере должен быть установлен MS Word последних версий.
Ответов: 793
Рейтинг: 168
|
|||
карма: 16 |
|
Редактировалось 1 раз(а), последний 2024-01-24 07:20:42