среда, 13 февраля 2013 г.

кнопка поиска в тотал командер

Для этого надо скопировать комплект файлов соответствующего конвертера непосредственно в папку с плагином (из дальнейшего станет ясно, почему именно так). Файл настройки плагина должен быть соответствующим образом сконфигурирован. В настройках архиваторных плагинов выполнить ассоциацию требуемых типов файлов с плагином. Теперь достаточно выделить файлы на файловой панели ТС, нажать кнопку "Распаковать файлы" на панели инструментов и после соответствующего диалога начнется извлечение в текстовые файлы с исходными именами в папку, открытую на неактивной файловой панели.

1.2. Существует и более легкий способ группового извлечения текстов - при помощи плагина executor , с моими настройками -

Надо создать временную папку, скопировать туда индексируемые .djvu файлы, конвертер и созданный .bat файл. Групповым переименованием поменять названия исходных файлов на номера, начиная с 01.djvu. Затем запустить .bat файл. После того, как будут получены все выходные текстовые файлы без расширений, надо запустить вторую копию коммандера и в ней удалить из временной папки все исходные *.djvu, а полученным текстовым файлам групповым переименованием присвоить расширения .djvu. После этого перейти в первое окно ТС и произвести откат группового переименования. В результате имеем текстовые файлы с именами исходных файлов и расширениями .djvu. Остается заменить расширения на .txt.

Дальнейшие действия с помощью TC напоминают танец с бубном.

Надо один раз создать *.bat файл, например, на 99 файлов, использовать его можно многократно. Содержание .bat файла может быть, например, таким:

Здесь и далее под конвертером понимается комплект из файла *.exe и необходимых для его работы компонентов. В случае *.djvu достаточно пяти файлов:

Штатными средствами WinDjView извлекает текст из *.djvu в кодировку ANSI, но по одному файлу. Используя конвертер djvutxt.exe из комплекта DjVuLibre можно это делать групповым образом.

1.1. Предлагаю для рассмотрения вариант ручного индексирования файлов с минимальной установкой дополнительных компонентов.

1. Поиск с индексированием вручную.

Все дальнейшее описание связано с применением файлового менеджера Total Commander (далее в тексте TC), у меня установлена версия 7.50а. Если на панели инструментов (тулбаре) отсутствует кнопка "Поиск файлов" в виде бинокля, ее лучше установить. Кликнуть правой кнопкой по свободному месту тулбара, выбрать "Изменить" и "Добавить", заполнить поля в диалоговом окне:

Рассмотрим поиск с предварительной индексацией. Кроме коммерческой программы Архивариус 3000 существуют бесплатные: штатная служба индексирования в Windows и Windows Searсh от MS, поисковики от Яндекса и Google для поиска "внутри компьютера", но все они требуют установки фильтров (Ifilter), которые по-существу являются извлекателями текста из файлов разного формата и часто требуют установки дополнительных компонентов, таких как NET Framework.

Если скопированный текст не читается, возможно, поможет обработка исходного файла утилитой pdf-recode.

С файлами формата .pdf, имеющими текст на кириллице, все бывает сложнее. Кодировки и шрифты используют "кто на что горазд". Возможность поиска для каждого файла следует проверить. Простой способ - выделить кусок текста и скопировать его в блокнот. Если текст не копируется, возможно, файл защищен от копирования. Снять защиту можно утилитой A-PDF Password Security . Хотя она коммерческая, но опция снятия пароля работает бесплатно.

Существуют две возможности текстового поиска - с предварительной индексацией и без. По ходу следует отметить принципиальную возможность текстового поиска только в файлах с распознанным текстом. По стандарту текстовый слой в *.djvu файлах должен быть в UTF-8, но иногда он встречается в кодировке Windows-1251 (кодовая страница, далее я буду для краткости называть ее ANSI, хотя это несколько разные понятия).

Каталогизация литературы - актуальная проблема, особенно для людей, которые занимаются научной, инженерной и преподавательской работой. Данная тема рассматривалась на разных форумах, например, , и других. Вопрос можно разделить на две части - собственно составление каталогов и текстовый поиск.

Обнаружив ошибку на странице, выделите ее и нажмите Ctrl + Enter

Текстовый поиск с помощью Total Commander

Предварительный вариант

Химия и Химики 4 2011

Химия и Химики 4 2011. Текстовый поиск с помощью Total Commander

Комментариев нет:

Отправить комментарий