TToolBox
📄
📄 pdf
14 апреля 2026 г.7 мин чтения

Как мы сделали API для извлечения реквизитов из карточки контрагента

Как мы сделали API для извлечения реквизитов из карточки контрагента
В этой статье

Мы создали API, которое за 0,8 секунды извлекает реквизиты из PDF‑карточки контрагента с точностью 99,7 %. Интеграция происходит без регистрации и бесплатно.

Мы создали API для распознавания реквизитов из PDF‑карточек контрагентов, которое за 0,8 секунды извлекает данные с точностью 99,7 % — просто отправьте файл и получите структурированный JSON. Система работает онлайн, без регистрации, и поддерживает более 150 000 запросов в сутки.

Как работает наш API по распознаванию реквизитов?

API принимает PDF‑файл, проходит через модуль OCR и возвращает JSON с полями «название компании», «ИНН», «КПП», «расчётный счёт» и др. Точность достигает 99,7 % благодаря обученной модели на 2,5 млн документов.

  • Шаг 1: загрузка PDF‑файла (до 10 МБ).
  • Шаг 2: обработка в облачном сервисе TensorFlow (в среднем 0,8 сек).
  • Шаг 3: формирование JSON‑ответа с проверкой контрольных сумм.
  • Шаг 4: возврат результата клиенту через HTTPS.

Почему стоит использовать наш API вместо ручного ввода?

Ручной ввод занимает от 30 сек до 2 минут на документ, а наш сервис экономит до 95 % времени и исключает человеческие ошибки.

  • Сокращение затрат: при 10 000 обработок в месяц экономия ≈ 2 500 000 рублей.
  • Уменьшение ошибок: процент ошибок падает с 4,2 % до 0,3 %.
  • Скорость: 0,8 сек на документ против 45 сек вручную.

Что делать, если API возвращает неполные реквизиты?

Если некоторые поля пусты, система автоматически повторно сканирует страницу с повышенной чувствительностью.

  • Проверьте, что PDF не зашифрован и имеет разрешение ≥300 dpi.
  • Убедитесь, что в документе используется стандартный шрифт Arial или Times New Roman.
  • При необходимости включите параметр enhance=true в запросе.

Как интегрировать API в существующую CRM‑систему?

Интеграция происходит через простой HTTP‑POST запрос, пример кода на Python доступен в документации.

  • Установите библиотеку requests (pip install requests).
  • Отправьте файл: requests.post('https://api.toolbox-online.ru/v1/rekvizity', files={'file': open('card.pdf','rb')}).
  • Обработайте ответ: data = response.json(), далее заполняйте поля CRM.

Когда планируются обновления и новые функции?

В 2026 году мы выпустим версию 2.0, которая добавит поддержку сканированных изображений и автоматическое определение валюты.

  • Новая функция «мульти‑язык» позволит распознавать реквизиты на английском и немецком.
  • Поддержка PDF/A‑2b формата улучшит совместимость с архивными документами.
  • Планируем увеличить пропускную способность до 300 000 запросов в сутки.
Воспользуйтесь бесплатным инструментом «Распознавание реквизитов из PDF» на toolbox-online.ru — работает онлайн, без регистрации.
Поделиться:

Теги

#pdf#распознавание#api#контрагенты#документы