Конвертер PDF/EPS этикеток Честный Знак в CSV/TXT/XML/JSON
Что может?
- Конвертация PDF/EPS файлов с этикетками Честный Знак в файл CSV/TXT для дальнейшего использования в учетной системе.
-
Высокая скорость обработки - примерно 20 000 кодов в минуту (Core i5-12400) в
PRO
версии или, примерно, 1000 кодов в бесплатной версии. - Никаких настроек и шаблонов. Конвертер автоматически находит и распознает все коды, сколько их и как бы они небыли расположены.
- Постобработка полученных кодов для удобной загрузки в учетную систему.
Сценарий использования
При генерации кодов в системе Честный Знак отсутствует возможность получения полного кода Data Matrix (с криптохвостом). Для загрузки в учетную систему полного кода маркировки, необходимо конвертировать готовые этикетки, сгенерированные сервисом Честный Знак, в CSV/TXT файл. Данный конвертер загружает PDF/EPS файл(ы) и распознает все коды Data Matrix и размещает их в общем выходном файле.
ВНИМАНИЕ! После получения выгрузки необходимо проконтролировать, чтобы количество кодов в исходном документе совпадало с выходным.
Установка
Установка конвертера осуществляется программой установки из раздела загрузки. Для работы программы необходима активации бесплатной или коммерческой лицензии. Для активации и проверки обновлений необходим доступ к сайту https://bash-it.ru/.
Деактивация лицензии
Для деактивации ранее активированной лицензии (бесплатной или PRO
), необходимо нажать правой кнопкой мыши по заголовку окна конвертера
и выбрать пункт меню "Деактивировать лицензию". Это может потребоваться, если вы после тестирования бесплатной версии приобрели PRO
версию.
Информация по FNC1
в GS1 Datamatrix
FNC1
(0xE8) обозначает начало данных, соответствующих стандарту GS1, или используется как разделитель между элементами данных. Именно к таким относится код маркировки Честного знака.FNC1
не имеет печатного ASCII-кода, используемый исключительно в штрих-кодах (например, GS1-128, GS1 DataMatrix и других). Он не соответствует ни одному символу в таблице ASCII, так как служит для внутренней интерпретации декодерами штрих-кодов.- При декодировании сканером штрих-кода,
FNC1
чаще всего заменяется наGS
(Group Separator) с ASCII-кодом 29 (0x1D). Это делается для удобства передачи и обработки данных в текстовых системах. Именно поэтому при работе конвертера вначале кода есть символGS
. - При записи в файл
0xE8
будет добавлен символè
(латинская буква «e» с грависом), который может быть корректно декодирован толькоISO-8859-1 (Latin 1)
,ISO 8859-15 (Latin-9)
,Windows-1252
и т.д. кодировками. Конвертер начиная с версии 3.1.3 использует кодировкуISO-8859-1 (Latin 1)
для записи выходных данных.
Можно ли печатать код с GS
?
Да, можно, но с оговоркой.
Если распечатать «идеально правильный» GS1 Datamatrix с FNC1
, то, при считывании сканером штрих-кода, на выходе вы получите данные вида «GS
12345». Если распечатать «обычный»
Datamatrix с GS
вначале данных, то, при считывании сканером штрих-кода, на выходе вы получите данные вида «GS
12345». Другими словами - абсолютно идентичный результат.
Проблема возникнет, когда считывающее устройство или приложение анализирует не выходные текстовые данные, а входное графическое изображение datamatrix и контролирует наличие FNC1
.
Это не частый сценарий, но он возможен.
Все приложения Честный знак сканируют код как обычный Datamatrix и проверяют наличие GS
в начале выходных данных,
что гарантирует прохождение всех проверок и код маркировки будет корректным.
Как сделать правильно?
При конвертировании выбрать формат постобработки «Удалить первый GS PRO
», а при печати выбрать формат кода «GS1 Datamatrix», а не просто «Datamatrix».
В этом случае программа печати сама добавит FNC1
перед началом кода и корректно его распечатает.
Программы печати могут автоматически печатать GS1 Datamatrix с FNC1
, обнаружив в начале входных данных символ GS
, но это необходимо проверить.
В кассовом ПО часто обработаны оба варианта и проблем не возникает.
Как проверить код?
Простой метод - сканировать приложением Чекмарк. Приложения Честного Знака считают и коды с GS в начале правильными.
Командная строка PRO
PRO
версия программы позволяет использовать режим командной строки:
taa.crptpdf2csv.exe -i <source> -r true -f 1 -p 0 -s 5000 -h <header> -d 0 -o <destination>
-i
- путь к входным данным. Путь может быть к конкретному файлу или папке.-r true
- просматривать вложенные папки, если в-i
указан путь к папке.-
-f
- формат выходных данных:1
- CSV2
- TXT3
- XML5
- CSV без заголовка6
- TXT без заголовка10
- JSON
-
-p
- подготовка кода:0
- без обработки;1
- удалить непечатные символы;2
- заменить на печатные символы;3
- удалить первый GS префикс;4
- приведение к стандарту GS1;1000
- специализированная подготовка кода (при наличии персонального обработчика).
-s 5000
- разбить выходные данные в файлы по5000
записей.0
- для отключения разбиения.-h
- задать заголовок файла для формата-f
поддерживающего заголовки;-
-d
- контроль дубликатов:0
- без контроля;1
- контроль на уровне пачки (файла);2
- контроль на уровне всех входных пачек (файлов). Требуется больше ресурсов.;
-o
- выходной файл (расширение не контролируется). Выходной файл перезаписывается.
Exit Code
отличным от 0.
Бесплатная версия
- Распознавание табличных шаблонов
- Разбиение выдачи
- Базовые форматы вывода
- Базовые преобразования
- Один поток распознавания
- Журнал проблем
* - PRO
версия доступна только для юридических лиц и индивидуальных предпринимателей.
Подробнее про отличия PRO
версии программы от бесплатной:
- Использование компьютерного зрения вместо подбора шаблона для поиска кодов на странице, дающее еще больший прирост и гарантированное распознавание самых экзотических шаблонов.
- Оптимизированная (улучшенный по скорости алгоритм) и многопоточная обработка, позволяющая ускорить обработку больших заданий более чем кратно количеству вычислительных ядер процессора компьютера. Примерно, 20 000 кодов (страниц) в минуту на процессоре Core i5-12400.
- Контроль дубликатов КИЗ. Станция заказов Честный Знак (ошибочно) допускает дублирование КИЗов при обработке больших заказов.
- Запуск конвертера с командной строкой.
- Наличие дополнительных форматов и обработчиков.
- Возможность разработки произвольных (пользовательских) выходных форматов.
Что нового?
- 3.2.2
- Улучшен механизм распознавания.
- Исправление незначительных ошибок.
- 3.2.1
- Улучшен механизм распознавания EPS формата. Добавлено журналирование проблем при распознавании EPS.
- 3.2.0
PRO
Реализована поддержка этикеток выгруженных в формате EPS.- 3.1.4
- Улучшен механизм компьютерного зрения
- Исправлена ошибка возникающая при использовании разбиения по количеству кодов, но количество кодов не кратно этому разбиению.
- Добавлено создание файла
error.log
с отладочной информацией, если в основном процессе конвертера возникла непредвиденная ошибка. - 3.1.3
- Добавление постобработки для совместимости с GS1 Datamatrix - добавляется символ
FNC1
в начало кодов. Теперь эти данные можно считывать и печатать напрямую (необходимо учитывать кодировку файла). - ! Замена выходной кодировки выходных файлов с
UTF-8
наISO-8859-1 (Latin 1)
для совместимости с символомFNC1
в выходных файлах. - 3.1.1
- Удаление постобработки GS1, добавленной в версии 3.1.0.
- 3.0.15
- Добавлена функция деактивации (удаления активированной) лицензии.
- 3.0.14
-
PRO
Реализованы механизмы компьютерного зрения вместо подбора шаблона:- Моментальный поиск кодов на странице
- Определение точных границ кодов увеличивает скорость распознавания на 20%.
- Внимание! Возможна несовместимость с пользовательскими модулями расширения версии 2.Х. В случае проблем - запрашивайте новую версию через службу поддержки.
- 2.4.10
- Добавлено распознавание новых видов макетов размещения кодов.
- 2.4.9
- Добавлено распознавание новых видов макетов размещения кодов.
- Оптимизация алгоритмов распознавания макета.
- 2.4.6
- Исправлена проблема определения макета файла при обработке больших пакетов файлов.
- 2.4.4
- Улучшение в модуле распознавания с табличным представлением кодов. Теперь скорость обработки значительно увеличена.
- Улучшение стабильности при работе в командной строке.
- Улучшение стабильности.
- 2.2.0
- Улучшение в модуле распознавания.
PRO
добавлен обработчик - удаление префиксаGS
(в начале) из кода.- 2.1.1
- Исправление в модуле распознавания.
- 2.1.0
- Улучшена стабильность новых механизмов.
PRO
Добавлен механизм контроля дубликатов КИЗ как по файлу, так и по всем файлам сразу. Дубликаты отбрасываются и включаются в журнал проблем.PRO
Добавлен функционал командной строки.- 2.0.6
- Улучшена стабильность
- Значительно улучшен механизм распознавания позволяющий получить хороший прирост скорости обработки каждой страницы файла
- Переработана статистика по процессу обработки файлов
- Добавлена платная
PRO
версия функционала PRO
Реализован многопоточный алгоритм распознавания, позволяющий значительно увеличить скорость обработки больших пакетов файлов.- 1.5.4.67
- Улучшена стабильность
- Из установочного пакета удалены дистрибутивы зависимостей. Теперь они скачиваются при необходимости.
- 1.5.3.61
- Добавлен формат TXT с заголовком
- Добавлена возможность задать заголовок для форматов поддерживающих заголовок
- Добавлена возможность разбиения выходных данных с лимитом количества строк на один файл
- Добавлена возможность формирования файла с проблемами распознавания. Проблемой считается если на странице обнаружено кодов меньше, чем было обнаружено на первой.
- Улучшена индикация процесса при обработке нескольких файлов.
- По завершению работы программа выводит сводку по количеству обработанных страниц PDF/EPS и количеству распознанных кодов.
- 1.4.2.43
- Добавлено сохранение последнего используемого формата выдачи и обработки записей
- Добавлен механизм поиска обновлений программы (проверка не чаще раза в сутки)
- Из установочного пакета исключен дистрибутив .NET, теперь он загружается при необходимости
- 1.4.0.41
- Улучшен (зарезервирован) механизм распознавания кодов DataMatrix
- 1.3.0.39
- Переработан внутренний механизм обработки выходных данных (форматы и фильтрация данных)
- 1.2.2.38
- Исправлена ошибка обработки путей
- 1.2.2.37
- Улучшена производительность
- Улучшен механизм поиска изображений
- Улучшена стабильность
- 1.1.9
- Добавлены выходные форматы XML и JSON
- Улучшена стабильность
- 1.0.3
- Стартовый релиз