HiAsm

Форумы "Игра в слова"Дело было вечером, делать было нечего… ← Ctrl12 3 4 5...7 8 9 10 11Ctrl →

Ответов: 1126

Рейтинг: 224

#1: 2024-01-24 07:20:27 ЛС | профиль | цитата

Sersey, Протестировал. Результаты не впечатлили. (PDF-файлы для тестов - https://disk.yandex.ru/d/PbyjMm4loWm5xA )
Python:
Извлекает таблицы из 2–5% PDF-файлов.
Не определяет таблицы, которые расположены внутри текста и в многостраничных PDF.
Хорошо определяет если таблица только одна на странице и в документе PDF можно выделить и скопировать текст.
VBJScript:
Находит и распознаёт таблицы в 80–90 % PDF-файлов.
Хорошо распознаёт таблицы в многостраничных и в отсканированных документах.
Главный недостаток – на компьютере должен быть установлен MS Word последних версий.

карма: 20

Редактировалось 1 раз(а), последний 2024-01-24 07:20:42

Форумы "Игра в слова"Дело было вечером, делать было нечего… ← Ctrl12 3 4 5...7 8 9 10 11Ctrl →