Word、Excel、およびPowerPointのドキュメントから画像、テキスト、および埋め込みファイルを抽出する方法
誰かがあなたにたくさんの画像を含むWord文書を送ったとしたら、あなたはそれらの画像をあなたのハードドライブに保存して欲しいと思う。あなたは簡単なトリックでMicrosoft Officeドキュメントから画像を抽出することができます.
画像などのファイルが埋め込まれたWord(.docx)、Excel(.xlsx)、またはPowerPoint(.pptx)ファイルがある場合は、それぞれを個別に保存しなくても(文書のテキストと同様に)それらを抽出できます。 。そして何よりも、追加のソフトウェアは必要ありません。 Office XMLベースのファイル形式(docx、xlsx、およびpptx)は、実際には圧縮アーカイブであり、Windowsで通常の.zipファイルと同じように開くことができます。そこから、画像、テキスト、その他の埋め込みファイルを抽出できます。あなたは、Windowsの組み込みの.zipサポート、またはあなたが好めば7-Zipのようなアプリを使うことができます。.
.doc、.xls、または.pptファイルのような古いオフィスの文書からファイルを抽出する必要がある場合は、小さなフリーソフトウェアでそれを実行できます。このガイドの最後にそのプロセスを詳しく述べます。.
新しいOfficeファイル(.docx、.xlsx、または.pptx)の内容を抽出する方法
XMLベースのOfficeドキュメントの内部コンテンツにアクセスするには、ファイルエクスプローラ(またはWindows 7の場合はWindowsエクスプローラ)を開き、コンテンツを抽出するファイルに移動してファイルを選択します。.
「F2」を押してファイルの名前を変更し、拡張子(.docx、.xlsx、または.pptx)を「.zip」に変更します。ファイル名の主要部分はそのままにしておきます。終了したらEnterキーを押します.
次のダイアログボックスは、ファイル名拡張子を変更することについて警告します。 「はい」をクリック.
Windowsは自動的にファイルをzipファイルとして認識します。ファイルの内容を抽出するには、ファイルを右クリックしてポップアップメニューから[すべて抽出]を選択します。.
「保存先の選択とファイルの抽出」ダイアログボックスの「ファイルをこのフォルダに抽出する」編集ボックスに、.zipファイルの内容を抽出するパスが表示されます。デフォルトでは、ファイル名と同じ名前のファイル拡張子を除いたフォルダが、.zipファイルと同じフォルダに作成されます。ファイルを別のフォルダに抽出するには、[参照]をクリックします。.
必要に応じて、「New folder」をクリックして.zipファイルの内容を解凍する場所に移動します。 「フォルダを選択」をクリック.
抽出されたファイルを含むフォルダーが抽出された後に表示されているファイルエクスプローラー(またはWindowsエクスプローラー)ウィンドウを開くには、「完了時に抽出ファイルを表示」チェックボックスを選択してボックスにチェックマークを付けます。 「抽出」をクリック.
抽出した画像にアクセスする方法
元のファイルがWord文書の場合(またはExcel文書の場合は「xl」、PowerPoint文書の場合は「ppt」)、抽出されたコンテンツには「word」という名前のフォルダーが含まれます。それを開くために「word」フォルダをダブルクリックします.
「メディア」フォルダをダブルクリック.
元のファイルのすべての画像は「media」フォルダにあります。抽出されたファイルは、文書で使用されている元の画像です。ドキュメント内には、サイズ変更やその他のプロパティが設定されている場合がありますが、抽出されたファイルはこれらのプロパティが適用されていない生の画像です。.
抽出したテキストにアクセスする方法
OfficeがPCにインストールされておらず、Word(またはExcelまたはPowerPoint)ファイルからテキストを抽出する必要がある場合は、 "word"フォルダの "document.xml"ファイルに抽出されたテキストにアクセスできます。.
このファイルはメモ帳やワードパッドなどのテキストエディタで開くことができますが、無料プログラムのXMLメモ帳などの特殊なXMLエディタで読みやすくなります。ファイルからのすべてのテキストは、文書自体に適用されているスタイルやフォーマットに関係なく、プレーンテキストのまとまりで使用できます。もちろん、このテキストを見るために無料のソフトウェアをダウンロードしようとしているなら、LibreOfficeをダウンロードすることもできます。これはMicrosoft Officeドキュメントを読むことができます。.
埋め込みOLEオブジェクトまたは添付ファイルを抽出する方法
Wordにアクセスできない場合にWord文書内の埋め込みファイルにアクセスするには、まずWordPad(Windowsに組み込まれています)でWordファイルを開きます。埋め込みファイルのアイコンの中には表示されないものもありますが、まだそこにあります。一部の埋め込みファイルには、部分的なファイル名があります。ワードパッドはWordのすべての機能をサポートしているわけではないので、一部のコンテンツは不適切に表示される可能性があります。しかし、あなたはファイルにアクセスすることができるはずです.
サンプルWordファイル内の埋め込みファイルの1つを右クリックした場合の選択肢の1つは、「PDFオブジェクトを開く」です。これにより、PC上のデフォルトのPDFリーダープログラムでPDFファイルが開きます。そこから、あなたはあなたのハードドライブにPDFファイルを保存することができます.
ワードパッドにファイルを開くオプションがない場合は、ここでファイルの種類をメモしてください。たとえば、この文書の2番目のファイルは.mp3ファイルです。.
次に、「Files from [Document]」フォルダに戻り、「word」フォルダ内の「embeddings」フォルダをダブルクリックします。.
残念ながら、ファイルタイプはファイル名に保存されていません。それらはすべて代わりに「.bin」ファイル拡張子を持っています。ファイルにどの種類のファイルが埋め込まれているかがわかっている場合は、ファイルのサイズからどのファイルがどれであるかを推測できます。この例では、PDFファイルとMP3ファイルがドキュメントに埋め込まれています。 MP3ファイルはPDFファイルよりも大きい可能性が高いため、ファイルのサイズを調べて正しい拡張子を使用して名前を変更することで、どのファイルがどれであるかを判断できます。以下で、MP3ファイルの名前を変更しています.
すべてのファイルがこのプロセスを使用して開くとは限らないことに注意してください。たとえば、PDFファイルはワードパッドから正しく開かれましたが、.binファイルの名前を変更しても開くことはできませんでした。.
圧縮ファイルの内容を抽出したら、元のファイルの拡張子を.docx、.xlsx、または.pptxに戻すことができます。ファイルはそのまま残り、対応するプログラムで通常通りに開くことができます.
古いOfficeドキュメント(.doc、.xls、または.ppt)から画像を抽出する方法
Office 2003(またはそれ以前の)ドキュメントから画像を抽出する必要がある場合は、この作業を簡単にするOffice Image Extraction Wizardという無料のツールがあります。このプログラムでは、(同じ種類または異なる種類の)複数のドキュメントから同時に画像を抽出することもできます。プログラムをダウンロードしてインストールします(インストールしたくない場合は、ポータブル版もあります)。.
プログラムを実行すると、ようこそ画面が表示されます。 「次へ」をクリック.
まず、画像を抽出したいファイルを選択する必要があります。 [入出力]画面で、[ドキュメント]編集ボックスの右側にある[参照](フォルダアイコン)ボタンをクリックします。.
目的の文書が含まれているフォルダに移動して選択し、[開く]をクリックします。.
選択したファイルを含むフォルダが自動的に出力フォルダになります。選択したファイルと同じ名前のサブフォルダをそのフォルダ内に作成するには、[ここにフォルダを作成]チェックボックスをクリックして、ボックスにチェックマークを付けます。次に、「次へ」をクリックしてください。.
[開始準備完了]画面で、[開始]をクリックして画像の抽出を開始します。.
抽出処理中に次の画面が表示されます。.
完成した画面で、「ここをクリックしてインストール先フォルダを開く」をクリックして、結果の画像ファイルを表示します。.
サブフォルダを作成することを選択したので、ファイルから抽出された画像ファイルを含むフォルダを取得します。.
あなたは番号付きファイルとしてすべての画像を見るでしょう.
一度に複数のファイルから画像を抽出することもできます。これを行うには、[入力と出力]画面で[バッチモード]チェックボックスをクリックして、チェックボックスをオンにします。.
バッチ入出力画面が表示されます。 「ファイルを追加」をクリックします.
[開く]ダイアログボックスで、画像を抽出するファイルを含むフォルダに移動し、[Shift]キーまたは[Ctrl]キーを押して複数のファイルを選択し、[開く]をクリックします。.
別のフォルダからファイルを追加するには、もう一度[ファイルの追加]をクリックし、[開く]ダイアログボックスでそのフォルダに移動して目的のファイルを選択し、[開く]をクリックします。.
画像の抽出元となるすべてのファイルを追加したら、[ファイルの保存先]をクリックして、画像ファイルが保存される各文書と同じフォルダ内に、各文書用に個別のフォルダを作成することを選択できます。 [各文書]チェックボックスがオンになっているため、ボックスにチェックマークが付いています。.
出力フォルダを「各ファイルの入力フォルダと同じ」にするか、編集ボックスとそのオプションの下にある「参照」ボタンを使用してカスタムフォルダを入力または選択することもできます。必要なオプションを選択したら、「次へ」をクリックしてください。.
開始準備完了画面で「開始」をクリックします。.
抽出の進行状況を示す以下の画面が表示されます。.
抽出された画像の数が[終了]画面に表示されます。 「閉じる」をクリックしてOffice Image Extractionウィザードを閉じます。.
ドキュメントごとに別々のフォルダを作成することを選択した場合は、画像を含むファイルと同じ名前のフォルダのうち、指定した出力フォルダが表示されます。.
繰り返しますが、すべての画像を各文書の番号付きファイルとして取得します。.
これで、画像の名前を変更したり、画像を移動したり、自分の文書でそれらを使用したりすることができます。合法的にそれらを使用する権利があることを確認してください.