DianaNeumann / Extract-DOC-Data

Extracts image and text from .doc files

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Данный скрипт извлекает все фотографии и текст из .doc документа.


Установка:

Зависимости:

pip install python-docx

Запуск:

  • Перейдите в папку с документом и вставьте туда скрипт (скрипт и документ должны быть в одной папке!).
  • python extract.py документ.doc

После выполнения появится папка "документ_files" со всеми файлами.

1

About

Extracts image and text from .doc files


Languages

Language:Python 100.0%