Распознавание таблиц OCR

Обнаруживайте и извлекайте таблицы из сканов

Выберите файлы или перетащите сюда Макс. размер файла: 20 MB · .pdf,.jpg,.jpeg,.png

Распознавание таблиц OCR

Что такое распознавание таблиц в OCR?

Распознавание таблиц в OCR — определение и извлечение таблиц из отсканированных документов. Алгоритмы определения сетки, распознавание таблиц без рамок и извлечение содержимого ячеек превращают бумажные таблицы в цифровой формат. Инструмент PdfMetric оцифровывает таблицы с сохранением структуры.

Ручное копирование таблиц из сканов сопряжено с риском ошибок. Определение таблиц находит границы строк и столбцов автоматически. Таблицы с рамками используют линии; без рамок — интервалы и выравнивание. Содержимое ячеек распознаётся отдельно, структура сохраняется.

Распознавание таблиц без рамок

Таблицы без рамок не имеют сетки. Структуру определяют пробелы между столбцами и строками. Алгоритмы выводят границы ячеек. Сложные объединённые ячейки трудны; простые таблицы обрабатываются с высокой точностью.

Часто задаваемые вопросы

Простые объединения распознаются. Сложные могут требовать ручной правки. Проверьте в Excel.

Таблицы экспортируются в Excel (XLSX) или CSV. Также в виде таблиц Word.

Как использовать

  1. Загрузите документ: Скан или изображение с таблицами.
  2. Включите распознавание таблиц: Применяется автоопределение.
  3. Скорректируйте области (опционально): Подтвердите или исправьте таблицы.
  4. Скачайте вывод: Таблица в Excel или CSV.

Совет: Ровные сканы высокого разрешения улучшают распознавание. Проверяйте сложные таблицы вручную.

Информация
  • Поддерживаемые форматы: .pdf,.jpg,.jpeg,.png
  • Макс. размер файла: 20 MB
  • Обработка: Сервер
Ваша конфиденциальность

Файлы надёжно обрабатываются и автоматически удаляются после обработки.