PDF — это формат «для чтения». Изменить адрес контрагента в готовом PDF-договоре или поправить опечатку в скачанном тексте напрямую не выйдет. Решение — конвертировать PDF в Word, отредактировать в привычном текстовом редакторе и при желании вернуть обратно.
Какие PDF конвертируются хорошо
- PDF, созданные из Word через «Сохранить как» или «Печать в PDF» — конвертация почти 1-в-1, всё форматирование сохраняется.
- Документы со встроенным текстом (PDF/A) — текст легко извлекается, таблицы переносятся со структурой.
- Стандартные коммерческие документы — договоры, счета, акты — обычно отлично распознаются.
С чем будут сложности
- Сканированные PDF без OCR — там нет текста, только картинки страниц. Получится Word с картинками внутри, редактировать его как текст не выйдет.
- PDF со сложной многоколоночной вёрсткой (журналы, газеты) — порядок текстовых блоков может сбиться.
- Документы с нестандартными шрифтами — Word подставит ближайшие аналоги, визуально может немного отличаться.
Если у вас скан без OCR — сначала прогоните его через распознавание текста, потом конвертируйте. Acrobat и Foxit умеют OCR; мы пока — нет, но добавим в будущих обновлениях.
Какой формат выбрать
На выходе мы даём DOCX (Word 2007+) — открывается в Microsoft Word, LibreOffice, Apple Pages и Google Docs. Старый формат .doc не нужен почти никому, поэтому его не предлагаем.