Задача: есть набор файлов формата pdf.
Часть из них с текстовым слоем. Часть без текстового слоя. Вперемешку.
Нужно их рассортировать, чтобы потом те, что без текстового слоя прогнать через Файн Ридер.
Сейчас это делается вручную – открывается файл Фокситом и осуществляется попытка запустить поиск по тексту.
Задолбался уже. Вторую неделю сижу. Может кто знает где там в спецификации pdf метка наличия текстового слоя? Можно ли эту метку увидеть например Тоталом или может есть какой плагин к Тоталу?
Помогите – глаза уже вылазят а еще 2000 файлов.
Часть из них с текстовым слоем. Часть без текстового слоя. Вперемешку.
Нужно их рассортировать, чтобы потом те, что без текстового слоя прогнать через Файн Ридер.
Сейчас это делается вручную – открывается файл Фокситом и осуществляется попытка запустить поиск по тексту.
Задолбался уже. Вторую неделю сижу. Может кто знает где там в спецификации pdf метка наличия текстового слоя? Можно ли эту метку увидеть например Тоталом или может есть какой плагин к Тоталу?
Помогите – глаза уже вылазят а еще 2000 файлов.