Вверх ↑
Ответов: 793
Рейтинг: 168
#1: 2024-01-24 07:20:27 ЛС | профиль | цитата
Sersey, Протестировал. Результаты не впечатлили. (PDF-файлы для тестов - https://disk.yandex.ru/d/PbyjMm4loWm5xA )
Python:
Извлекает таблицы из 2–5% PDF-файлов.
Не определяет таблицы, которые расположены внутри текста и в многостраничных PDF.
Хорошо определяет если таблица только одна на странице и в документе PDF можно выделить и скопировать текст.
VBJScript:
Находит и распознаёт таблицы в 80–90 % PDF-файлов.
Хорошо распознаёт таблицы в многостраничных и в отсканированных документах.
Главный недостаток – на компьютере должен быть установлен MS Word последних версий.
карма: 16

0
Редактировалось 1 раз(а), последний 2024-01-24 07:20:42