MS Officeファイルからテキストと画像を簡単に抽出する方法
MS WordやMS Powerpointファイルから画像やテキストを抽出する必要があるかもしれません。通常、これには手動でコピーして貼り付ける、一度に1ページずつ、メガサイズのファイルを含める場合、かなり時間がかかります。.
まあ、私たちはあなたを助けるために簡単なトリックを持っています 新しい形式のファイルから画像とテキストを抽出する すなわち、DOCX、PPTX、XLSX、つまり古い形式のファイル、すなわちDOC、PPT、XLSでは、必要なのは フリーソフトウェア すばやく簡単に画像を抽出するのに役立ちます.
注意: この記事のデモンストレーションを目的として、MS Wordファイルのみを使用します。プロセスは、MS PowerpointファイルとMS Excelファイルでも同じです。.
この記事の内容は次のとおりです。
- DOCX、PPTX、XLXSファイルから画像とテキストを抽出する方法
- 単一のDOC、PPTまたはXLSファイルから画像を抽出する方法
- 複数のDOC、PPTまたはXLSファイルから画像を抽出する方法
- 画像を抽出する方法 “Webページとして保存” 方法
- XMLの代わりにプレーンテキストを抽出する方法
DOCX、PPTX、XLXSファイルから画像とテキストを抽出する方法
手順を実行する前に、ファイルが含まれているフォルダを開きます。クリック 整理>フォルダと検索オプション>表示 そして チェックを外す 既知のファイルタイプの拡張子を隠す. これで、各ファイル名のファイル拡張子を見ることができます.
-
見つけて選択 画像とテキストを抽出したいファイル(注:このファイルのコピーを作成した方が良いです)。この例では、ターゲットファイルの名前は サンプルFile.docx.
-
押す F2 ファイルの名前を変更して拡張子を .ジップ.
-
ファイル拡張子の変更を確認するための警告が表示されます。クリック はい.
-
右クリック ZIPファイルをクリックして ファイルを抽出する.
-
抽出されたデータを含むフォルダを見つけて開き、次に ワード.
-
その中には、いくつかのフォルダーとXMLファイルがあります。の中に メディア フォルダあなたは抽出された画像を見つけるでしょう。抽出したテキストについては、 document.xml メモ帳またはXMLメモ帳を含むファイル.
これはあなたが見つけるでしょうものです メディア フォルダ.
単一のDOC、PPT、またはXLSファイルから画像を抽出する方法
MS Officeファイルから画像を抽出したい場合 古いフォーマット, 上記の方法は画像では動作しません。このためにはOffice Image Extraction Wizardという無料のツールが必要です。ツールは2012年までさかのぼるMS Officeファイルで動作し、一度に1つまたは複数のMS Officeファイルで動作します.
-
ダウンロードして インストール Office画像抽出ウィザード.
-
画像を抽出したい文書を選択してください(この例では、私が名前を付けたフォルダに移動しています)。 Ch1.doc)をクリックし、出力フォルダを選択します。あなたは、オプションをチェックすることによってあなたのすべてのあなたの出力イメージを収容するために作成されるフォルダーを持つことを選ぶことができます ここにフォルダを作成します. 完了したら、をクリックします 次.
-
クリック 開始 プロセスを開始する.
-
画像抽出プロセスが終了したら、をクリックします 宛先フォルダを開くにはここをクリック そしてそれは出力フォルダを開きます.
-
あなたが下記で見ることができるように、プログラムはaを作成しました Ch1 フォルダ.
-
フォルダ内には抽出された画像があります.
複数のDOC、PPTまたはXLSファイルから画像を抽出する方法
-
DOC、PPT、またはXLS形式の複数のファイルから画像を抽出するには、 バッチモード 左下にあるオプション.
-
クリック 追加ファイル その後 選択する あなたが画像を抽出したいファイル。を Ctrl 一度に複数のファイルを選択するためのボタン。ファイルを選択したら、をクリックします。 次.
-
クリック 開始.
-
プロセスが完了したら、次の場所に移動して開きます。 出力フォルダ. ここで、あなたは見るでしょう 2つのフォルダー 元のファイル名で. 開いた これらのフォルダを元のMS Officeファイルから抽出した画像を見るために.
「Webページとして保存」方法で画像を抽出する方法
両方で動作する別の方法があります 新しい そして 年上 MS Officeファイル.
-
DOCXまたはXLSXファイルを開き、をクリックします ファイル>名前を付けて保存>コンピュータ>ブラウザ ファイルを ウェブページ.
-
探します Webページを保存したファイル名のフォルダ。ここでは、ファイルから抽出されたすべての画像が表示されます。.
XMLの代わりにプレーンテキストを抽出する方法
-
DOCXファイルを開き、をクリックしてください。 ファイル>名前を付けて保存>コンピュータ>ブラウザ. ファイルを別名で保存する テキストで表示 (XLSXファイルの場合は、 テキスト(タブ区切り)).
-
探します そして 開いた 保存に使用した名前のテキストファイルこのテキストファイルには、元のファイルのテキストのみがフォーマットなしで含まれます。.
MS Officeファイルから画像を抽出する他の方法やツールを知っている場合は、 コメント セクション.