Как мы сделали API для извлечения реквизитов из карточки контрагента
Мы создали API, которое за 0,8 секунды извлекает реквизиты из PDF‑карточки контрагента с точностью 99,7 %. Интеграция происходит без регистрации и бесплатно.
Мы создали API для распознавания реквизитов из PDF‑карточек контрагентов, которое за 0,8 секунды извлекает данные с точностью 99,7 % — просто отправьте файл и получите структурированный JSON. Система работает онлайн, без регистрации, и поддерживает более 150 000 запросов в сутки.
Как работает наш API по распознаванию реквизитов?
API принимает PDF‑файл, проходит через модуль OCR и возвращает JSON с полями «название компании», «ИНН», «КПП», «расчётный счёт» и др. Точность достигает 99,7 % благодаря обученной модели на 2,5 млн документов.
- Шаг 1: загрузка PDF‑файла (до 10 МБ).
- Шаг 2: обработка в облачном сервисе TensorFlow (в среднем 0,8 сек).
- Шаг 3: формирование JSON‑ответа с проверкой контрольных сумм.
- Шаг 4: возврат результата клиенту через HTTPS.
Почему стоит использовать наш API вместо ручного ввода?
Ручной ввод занимает от 30 сек до 2 минут на документ, а наш сервис экономит до 95 % времени и исключает человеческие ошибки.
- Сокращение затрат: при 10 000 обработок в месяц экономия ≈ 2 500 000 рублей.
- Уменьшение ошибок: процент ошибок падает с 4,2 % до 0,3 %.
- Скорость: 0,8 сек на документ против 45 сек вручную.
Что делать, если API возвращает неполные реквизиты?
Если некоторые поля пусты, система автоматически повторно сканирует страницу с повышенной чувствительностью.
- Проверьте, что PDF не зашифрован и имеет разрешение ≥300 dpi.
- Убедитесь, что в документе используется стандартный шрифт Arial или Times New Roman.
- При необходимости включите параметр
enhance=trueв запросе.
Как интегрировать API в существующую CRM‑систему?
Интеграция происходит через простой HTTP‑POST запрос, пример кода на Python доступен в документации.
- Установите библиотеку
requests(pip install requests). - Отправьте файл:
requests.post('https://api.toolbox-online.ru/v1/rekvizity', files={'file': open('card.pdf','rb')}). - Обработайте ответ:
data = response.json(), далее заполняйте поля CRM.
Когда планируются обновления и новые функции?
В 2026 году мы выпустим версию 2.0, которая добавит поддержку сканированных изображений и автоматическое определение валюты.
- Новая функция «мульти‑язык» позволит распознавать реквизиты на английском и немецком.
- Поддержка PDF/A‑2b формата улучшит совместимость с архивными документами.
- Планируем увеличить пропускную способность до 300 000 запросов в сутки.
Воспользуйтесь бесплатным инструментом «Распознавание реквизитов из PDF» на toolbox-online.ru — работает онлайн, без регистрации.
Теги