Как я могу извлечь данные из поврежденного файла .docx? - proUbuntu
Винтажный Клуб для гитаристов
2 голосов
/

Файл .docx моей подруги поврежден, и я пытаюсь восстановить текст из него. Я узнал, что .docx - это, по сути, zip-файл, содержащий папки и набор XML-файлов (и один из них содержит текст документа). Я следую команду на Ubuntu 10.10, чтобы распаковать архив:

unzip portfolio.docx -d file-dir

Результат, который я получил:

End-of-central-directory signature not found. Either this file is not a zipfile, or it constitutes one disk of multi-part archive. In the latter case the central directory and zipfile comment will be found on the last disk(s) of this archieve.
unzip: cannot find zipfile directory in one of portfolio.docx or portfolio.docx.zip, and cannot find portfolio.docx.ZIP, period.

В Windows 8.1 я пробовал WinZip, 7zip, WinRar и Zip2Fix, но безуспешно.

Файл весит почти 20 КБ, поэтому я знаю, что внутри есть какой-то контент. Есть ли способ принудительно распаковать ?

1 Ответ

4 голосов
/

Запустите это:

cp portfolio.docx portfolio.zip

Или просто переименуйте portfolio.docx в portfolio.zip, и вы сможете открыть результирующий файл portfolio.zip с помощью Archive Manager и извлечь их.

Редактировать: Я только что провел быструю проверку, файлы, вероятно, находятся в word/document.xml или docProps/core.xml в извлеченной папке.

Другое редактирование: Если результирующий zip-файл поврежден, посмотрите здесь .

Добро пожаловать на сайт proUbuntu, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...