Описание работы с программой PDF Recovery Kit

PDF Recovery Kit (Загрузить) разработана для восстановления поврежденных и не распознаваемых документов формата *.pdf. Этот формат документов является очень распространенным как в Интернете для передачи электронной документации, так и при использовании на локальном компьютере и часто такие файлы содержат очень важную информацию. С помощью PDF Recovery Kit можно восстанавливать:

  • Содержание файла pdf: текста, графики, таблиц, гиперссылок и форм, использующихся в документе.
  • Структуру файла pdf: таблицы внутренних перекрестных ссылок, являющиеся основой структуры документа. При повреждении этих таблиц документ может оказаться нечитаемым. Программа может восстанавливать эти данные и ссылки, которые в них используются.
  • Шрифты и другие метаданные: интегрированные шрифты и другие метаданные.
  • Параметры файла pdf: информация о версии файла и о размере страниц. В случае, если восстановление параметров страниц невозможно, есть возможность задать значение параметров страницы вручную по умолчанию для всего документа.

Рассмотрим процесс восстановления документа *.pdf с помощью программы PDF Recovery Kit

Восстановление *.pdf файлов выполняется в несколько этапов:

Для изучения работы с программой Вы можете скачать пробную версию, обладающую полными возможностями по анализу документа, однако полностью сохраняющую только первую страницу исходного файла. На всех остальных страницах восстановленного документа будет написан текст DEMO.

1. Выбор поврежденного файла для восстановления

Сразу после запуска программы PDF Recovery Kit открывается окно выбора файла pdf для восстановления. Выбор нужного файла можно осуществлять тремя способами:

  • Ввод пути и имени файла в поле с выпадающим списком Source file name (.pdf): (Имя исходного файла(.pdf):), которое находится в основной рабочей части окна. При вводе имени файла и пути к нему используется автоматическое заполнение поля информацией из выпадающего списка файлов, которые восстанавливались программой ранее. Для автоматического заполнения используется последний открывавшийся файл, соответствующий вводимой информации.
  • Выбор файла для восстановления с помощью стандартного диалога открытия файлов. Этот диалог вызывается кнопкой Открыть , находящейся справа от поля с выпадающим списком Source file name (.pdf). При открытии диалога впервые, для выбора файла используется папка, в которой находится программа PDF Recovery Kit. При повторном вызове диалога открывается папка, путь к которой введен в поле ввода, а в случае, если невозможно открыть эту папку или информация в поле отсутствует, открывается последняя папка, которая открывалась ранее с помощью диалога открытия файлов.
  • Выбор ранее открывавшегося файла из выпадающего списка поля Source file name (.pdf). При работе программы информация о восстанавливаемых файлах, такая как имена файлов, которые выбираются пользователем для восстановления, и пути к ним, сохраняется в ее настройках, и при необходимости эти файлы можно открыть повторно. При необходимости, список последних открывавшихся файлов можно очистить с помощью пункта меню Tools | Clear lists | Source files (Инструменты | Очистка списков | Исходные файлы).

После выбора восстанавливаемого файла рекомендуется проверить и, при необходимости, изменить настройки программы, относящиеся к восстановлению документа. Окно настроек вызывается с помощью пункта меню Tools | Options… (Инструменты | Опции…). Работа с настройками программы PDF Recovery Kit описана в пункте 2.

В нижней части окна выбора восстанавливаемого файла присутствует кнопка Send a file to developers (Отправить файл разработчикам), с помощью которой можно отправить документ pdf для анализа разработчикам программы PDF Recovery Kit. Также файл можно отправить разработчикам на любом этапе работы с программой с помощью пункта меню Tools | Send source file (Инструменты | Отправить исходный файл).

После выбора документа и установки параметров его восстановления, для запуска процесса анализа структуры файла и его контента нужно нажать кнопку Analyze (Анализировать), которая находится в нижней части окна программы. Процесс анализа восстанавливаемого документа описан в пункте 3.

В случае, если программа не найдет файл документа по указанному пути, будет выдано сообщение Please select an existing file to recovery (Пожалуйста, выберите существующий файл для восстановления) и перехода к следующему этапу работы программы не произойдет.

2. Установка настроек программы по умолчанию

Диалог настроек программы служит для установки параметров по умолчанию. Данные настройки необходимы, если исходный pdf файл не содержит информации о размере и ориентации страниц.

Настройка размера страницы по умолчанию в PDF Recovery Kit не является обязательным. Диалог настройки параметров программы можно вызвать с помощью пункта меню Tools | Options… (Инструменты | Опции…).

Окно настроек программы содержит следующие разделы:

  1. Paper format (Формат листа). Если восстанавливаемая страница не имеет заданный размер или эта часть файла была уничтожена, то пользователь программы PDF Recovery Kit может размеры страниц в документе по умолчанию.
  2. В данном разделе есть возможность установить один распространенных размеров, выбрав его из выпадающего списка - A4 (8,3 x 11,7 inches), Letter (8,5 x 11 inches), или указать, что будет использоваться формат, заданный пользователем (). При использовании одного из стандартных размеров можно с помощью правого поля с выпадающим списком указать ориентацию листа – Portrait (Книжная), Landscape (Альбомная).
  3. При использовании нестандартного формата бумаги возможность выбора ориентации листа будет заблокирована и будут разблокированы поля ввода размеров листа Width: (Ширина:) и Height: (Высота:), с помощью которых можно задать произвольную ширину и высоту листа в единицах измерения, указанных в поле с выпадающим списком Units: (Единицы измерения:) – inch (дюймы) или cm (сантиметры).

В случае если необходимо вернуться к стандартным настройкам, можно воспользоваться кнопкой Set defaults (Задать значения по умолчанию).

После установки описанных параметров, программа сохраняет их и использует при дальнейшей работе, в том числе при повторном запуске после выхода.

3. Анализ содержания исходного документа

После выбора файла для восстановления и нажатия кнопки Analyze (Анализировать) (пункт 1), программа переходит к этапу анализа документа.

В процессе анализа исходного документа программа PDF Recovery Kit производит следующие действия:

  1. Считывает структуру документа, определяет смещение, с которого начинаются данные таблиц перекрестных ссылок, идентифицирует их, сканирует и идентифицирует другие объекты в исходном файле. Кроме этого идентифицирует и другие параметры документа PDF.
  2. Извлекает из документа информацию о формате страницы. Если эту информацию извлечь не удалось, в дальнейшем будет использованы параметры страницы, указанные в настройках программы.
  3. Считывает информацию о внутренних ссылках. В документах pdf используются внутренние перекрестные ссылки, являющиеся основой размещения информации внутри документа.
  4. Идентифицирует метаданные, хранящиеся в документе. В некоторых файлах формата pdf хранятся встроенные шрифты, использованные в документе. Программе необходимо извлекать эту информацию для сохранения в восстановленном документе.
  5. Считывает из документа текстовую информацию. Значительная часть документов формата pdf хранит в себе большие объемы текстовой информации и гиперссылок.
  6. Извлекает из документа графическую и другую медиа-информацию. Помимо текстовой, в документах могут храниться также векторные и растровые графические элементы, формы и мультимедиа-вставки.

При анализе в основной части окна программы отображается следующая информация о процессе анализа документа:

  • Индикатор хода процесса Parsing file (Анализ файла). Помимо отображения полосы выполнения анализа файла в заголовке полосы также отображается процент выполнения анализа, объем обработанной информации и полный размер файла в килобайтах.
  • Информация об обнаруженных ошибках – сколько ошибок было найдено. Отображается в виде зеленой надписи No errors found (Ошибок не найдено), если все данные в файле были корректными, или красной надписи X errors found (Найдено X ошибок), где Х – количество ошибок, в случае если ошибки были обнаружены.

После завершения процесса анализа документа pdf, программа автоматически переходит к этапу выбора пути и имени файла для сохранения восстановленной информации.

4. Выбор имени *.pdf файла для сохранения восстановленной информации

На этом этапе предлагается выбрать путь и имя файла, в который будет сохраняться восстановленная информация из поврежденного PDF. Выбор файла можно производить тремя способами:

  1. Ввод пути и имени файла для сохранения результатов работы программы в вручную в поле названием Please select file name (Пожалуйста, выберите имя файла), которое находится в основной рабочей области окна программы. При открытии окна это поле со списком автоматически заполняется следующей информацией: Путь к файлу, в который будут сохраняться восстановленные данные в папке, в которой хранится исходный файл. Имя файла для сохранения состоит из имени исходного файла с добавлением строки _repaired. Например, если считывался файл example.pdf, то программа предложит сохранять информацию в файл example_repaired.pdf в той же папке, что и исходный файл.
  2. Выбор файла с помощью диалога. Справа от поля с выпадающим списком находится кнопка Открыть, с помощью которой можно вызвать стандартный диалог выбора папки и имени файла для сохранения. При открытии диалога программа предлагает создавать файл в той папке и с тем именем, которые указаны в поле с выпадающим списком.
  3. Выбор файла из выпадающего списка поля Please select file name. В процессе работы программа сохраняет информацию о ранее сохранявшихся файлах в своих настройках и при открытии окна выбора файла для сохранения заполняет выпадающий список поля ввода информацией об этих файлах (именами файлов и путями к ним). При необходимости, список сохраненных файлов можно очистить с помощью пункта меню Tools | Clear lists | Output files (Инструменты | Очистка списков | Результирующие файлы).

Также в основной части окна отображается информация о максимальном объеме дискового пространства, которое может занять восстановленный файл и о пространстве, доступном на выбранном для сохранения диске.

В случае необходимости, с помощью кнопки Back (Назад), можно вернуться на этап выбора файла для восстановления и изменить его.

Для продолжения работы с программой и перехода к этапу выбора формата сохраняемого документа, после выбора пути и имени сохраняемого файла нужно нажать кнопку Next (Далее). Если программа обнаружит по указанному пути файл с именем, совпадающим тем, которое введено в поле, будет выдано стандартное предупреждение Selected file already exists. Overwrite? (Выбранный файл уже существует. Перезаписать?). В случае, если в окне предупреждения будет нажата кнопка Yes (Да), файл будет сохранен под указанным именем. В случае, если будет нажата кнопка No (Нет), программа вернется к этапу выбора файла для сохранения.

5. Выбор версии формата *.pdf для сохраняемого документа

Программа PDF Recovery Kit может сохранять восстановленную информацию из исходного файла в любом формате PDF от 1.0 (Acrobat Reader 1.0) до 1.7 (Acrobat Reader 8.0). Однако следует иметь в виду, что при сохранении документа в формате предыдущих версий часть данных, несовместимая с версией сохраняемого файла, может быть потеряна или повреждена.

Выбрать формат сохраняемого файла осуществляется в поле с выпадающим списком Select output PDF file version: (Выберите версию результирующего PDF файла).

При открытии окна выбора формата сохраняемого документа программа автоматически предлагает сохранить восстанавливаемый документ в версии формата, совпадающей с исходным документом. В случае если исходный файл был поврежден настолько сильно, что не удалось определить его версию, программа по умолчанию предложит сохранить файл в последней доступной версии формата (в текущей версии программы это PDF 1.7, Acrobat Reader 8.0).

Также при сохранении файла может использоваться сжатие. При использовании сжатия результирующий документ будет занимать меньше места на диске, но процесс сохранения может занять больше времени. Включить сжатие документа можно с помощью флажка Enable compression (Разрешить сжатие).

После завершения настройки формата сохраняемого документа, для перехода к процессу восстановления и сохранения данных, нужно нажать кнопку Save file (Сохранить файл), которая находится в нижней части окна программы.

6. Восстановление и сохранение документа

Этап восстановления информации из исходного файла и сохранения ее в файл на диск проходит в автоматическом режиме и не требует вмешательства пользователя. Во время восстановления файла программа выполняет следующие действия:

  1. Check and recover (Проверка и восстановление). Программа проверяет и копирует в память компьютера выявленную ранее структуру документа и данные, исправляя найденные во время анализа ошибки.
  2. Check for obsolete objects (Проверка на наличие остаточных объектов). Проверяется наличие в документе остаточных объектов и их включение в документ.
  3. Compress and save objects (Сжатие и сохранение объектов). Выполняется сжатие объектов (если задано пользователем) и сохранение их в указанный пользователем файл. Во время выполнения этого пункта становится активной кнопка Abort (Прервать), находящаяся в нижней части окна, с помощью которой можно остановить процесс сохранения данных в файл. При нажатии на эту кнопку программа выдает окно с предупреждением Cancel file saving? (Отменить сохранение файла?). В случае, если в этом окне будет нажата кнопка No (Нет), процесс сохранения будет продолжен в обычном режиме. Если будет нажата Yes (Да), сохранение объектов будет прервано и программа перейдет к выполнению следующего пункта не завершая сохранение объектов.
  4. Save XRef section (Сохранение секции XRef). Сохранение секции внутренних перекрестных ссылок документа.
  5. Save trailer (Сохранение трейлера). Сохранение трейлера документа.

Во время выполнения каждого из указанных выше пунктов прогресс его выполнения показывается на индикаторе выполнения в основной рабочей области окна. Над индикатором отображается (в зависимости от действия, выполняемого программой в данный момент) строка Saving file… (Сохранение файла…), информация о выполняемом пункте восстановления документа Processing Х of 5 (Обрабатывается Х из 5), где Х соответствует выполняемому пункту, прогресс выполнения пункта в процентах и так далее. Под индикатором выполнения отображается список пунктов восстановления, в котором отмечается текущий пункт и зеленой галочкой отмечаются выполненные пункты. В случае если сохранение объектов было прервано, пункт Compress and save objects (Сжатие и сохранение объектов) будет отмечен красным крестом.

После завершения всех пунктов восстановления, программа автоматически перейдет к этапу просмотра отчета о восстановлении документа.

7. Просмотр отчета о восстановлении документа

На данном этапе в основном окне программы отображается текстовый блок с отчетом о текущем сеансе работы программы PDF Recovery Kit, содержащий секции, соответствующие каждому восстановленному в процессе работы файлу. Секция состоит из следующих строк:

  1. Дата и время начала процесса восстановления документа.
  2. Имя исходного файла и путь к нему File processed: (Обработанный файл:).
  3. Количество считанных объектов Read … objects (Считано …объектов).
  4. Имя результирующего файла и путь к нему Destination file: (Результирующий файл:).
  5. Количество сохраненных объектов Saved … objects (Сохранено … объектов).
  6. Отчет о результате обработки файла: Saving successful (Сохранение успешно) в случае успешного завершения процесса сохранения, Saving cancelled by user (Сохранение отменено пользователем) в случае если в процессе сохранения документа была нажата кнопка Abort (Прервать) или информацию об ошибке восстановления, если она возникла.
  7. Дата и время завершения процесса сохранения восстановленного документа.

После просмотра отчета можно вернуться к окну выбора файла для восстановления с помощью кнопки Back (Назад) или завершить работу с программой, нажав кнопку Finish (Завершить). При нажатии кнопки Finish (Завершить) программа выдаст окно с подтверждением Do you want to finish recovery? (Хотите ли вы завершить восстановление?). При выборе кнопки Yes (Да), программа завершит работу, в случае если будет нажата кнопка No (Нет), работа с отчетом будет продолжена.

Дополнение: Меню программы

Меню программы содержит следующие пункты:

  • File (Файл). Пункт содержит подпункты:
    • Exit (Выход). При выборе этого пункта происходит выход из программы.
  • Tools (Инструменты). Пункт содержит три подпункта:
    • Send source file (Отправить исходный файл). Служит для отправки файла документа pdf разработчикам программы для анализа
    • Сlear lists (Очистка списков). Содержит два подпункта:
      • Source files (Исходные файлы). Служит для очистки списка исходных файлов.
      • Output files (Результирующие файлы). Служит ля очистки списка результирующих файлов.
  • Options… (Опции…). Служит для настройки параметров программы, относящихся к восстанавливаемому документу. Подробно описан в этапе 2.
  • Help (Помощь) содержит следующие подпункты:
    • PDF Recovery Kit help (Помощь по программе PDF Recovery Kit). Вызов справки по программе.
    • PDF Recovery Kit on the Web (Домашняя страница программы PDF Recovery Kit). Переход на домашнюю страницу программы.
    • Buy now (Купить сейчас). Переход на страницу покупки программы
    • About (О программе). Вызов окна О программе.

В любой момент во время работы программы можно выйти из нее, выбрав пункт меню File | Exit (Файл | Выход), нажав кнопку Exit (Выход), которая находится в правом нижнем углу окна программы, или закрыв окно программы с помощью кнопки Закрыть заголовка окна. В случае выхода из программы произошел на этапах 1 – 4, процесс восстановления будет прерван, и восстановленный документ сохранен не будет. Если для выхода была использована кнопка Exit (Выход), программа выдаст окно с подтверждением Do you want to finish recovery? (Хотите ли вы завершить восстановление?). При нажатии кнопки Yes (Да), программа завершит работу. Если выбрана кнопка No (Нет), работа с документом будет продолжена. При использовании других методов выхода (меню или кнопка заголовка окна), программа будет завершена без предупреждения.

После завершения восстановления файла pdf, на этапе 7, функции кнопки выхода выполняет кнопка Finish (Завершить). Также на любом этапе кроме этапа 1 (выбора файла для восстановления) можно нажать кнопку Back (Вернуться), которая находится левее кнопки выхода из программы, для возврата назад и просмотра или изменения каких-либо параметров, заданных ранее. В том числе эту кнопку можно использовать для запуска процесса восстановления другого документа pdf.