Нода наглухо висла каждые полтора два часа. Смотрим в логи - видим утечку памяти. Чудеса. Тудымана-сюдымана, находим зависающую сессию. Звоним пользователю.
Та рада аж до состояния "щаслива" - "А вы знаете - у меня word не работает! Я тут документ открыть не могу, который вам в СЭД загружаю!"
Смотрю - размер файла 500+ мегабайт. Гм. Да.
"А что за файл-то такой? "
"А вот вы знаете - сейчас все договорные документы сейчас сшиваются, и отсканировать одной пачкой договор нельзя!"
"Ну."
"И вот я сканирую постранично в pdf!"
"Ну, а Word-то тут при чем?!"
"А вы принимаете в pdf, вот я все эти странички как картинки в word вставляю, а потом пересохраняю в PDF одним документом! А сейчас он не открывается! А когда я его вам загрузить пытаюсь ничего не получается!"
Ять. Ну, давайте вы мне все файлы выложите, а я их объединию. Как они у вас там называются? 1.pdf, 2.pdf, ..., 32.pdf? Ок.
gs -dBATCH -dNOPAUSE -q -sDEVICE=pdfwrite -sOutputFile=out.pdf ./* - а вот хрен.
05.04.2017 16:11 586 357 1.pdf
05.04.2017 16:14 4 545 934 10.pdf
05.04.2017 16:14 4 652 155 11.pdf
05.04.2017 16:15 4 973 473 12.pdf
05.04.2017 16:15 4 617 324 13.pdf
05.04.2017 16:15 1 347 017 14.pdf
05.04.2017 16:16 3 002 170 15.pdf
05.04.2017 16:16 4 757 447 16.pdf
05.04.2017 16:16 547 472 17.pdf
05.04.2017 16:17 5 096 961 18.pdf
05.04.2017 16:17 1 460 181 19.pdf
05.04.2017 16:12 3 122 028 2.pdf
эта .... сортирует не в нумерологическом, а в лексикографическом порядке! Ща, сделаем! for, split, sort - ять! ять-ять-ять! В результате простейшая задачка - полторы страницы bat-ника и 4 часа рабочего времени.
Блин, меня даже не заломало - ручками забить имена файлов - в районе 5 минут. Написать эту же самую хрень на python'е - 15. В sh проблемы вообще не возникло. И только bat-файлы...
И вот все у них так!!!