コマンドラインを使用して画像からテキストを抽出する方法
画像を読み、テキストを自分で引っ張るのは十分簡単です。しかし 動的にテキストを引っ張る 写真からは少し難しい、そしてありがたいことに, imgclip かなり簡単な解決策を提供します.
この コマンドラインツール Mac、Windows、およびLinux用の端末で動作します。それは単に言語と共に画像ファイルの引数を取ります。 テキストを返します クリップボードにコピーした.
あなたはnpmでライブラリ全体をインストールすることができます 非常に簡単なインストール. ことは わずか数KB GitHubで閲覧できるJSファイルが付属しています.
Imgclip Tesseract.jsを使用します 画像処理を自動化し、テキストを引き出すためのライブラリ OCR. これは今日までで最も強力なOCRライブラリの1つであり、imgclipのように完全にオープンソースです。.
私はこのツールの品質とスピードに最も感心していると思います。それは本当に働きます 正確なテキストを引き出す そしてそれは使用する最も簡単なツールの一つです.
imgclipコマンドは 端末で直接実行する, 画像への相対パスが続きます。追加することもできます 4つの選択肢 最後に出力をカスタマイズする.
-時間
,--助けて
: 使用情報を出力します-V
,--バージョン
: バージョン番号を出力します-l
,--ラング
: 画像内のテキストの言語を出力します-p
,--印刷する
: (クリップボードにコピーするのではなく)画像内のテキストを印刷します。
これを書いている時点で、Tesseract 65言語をサポート 途中でもっと。に追加するコード --ラング
tagはそれらのTesseractファイルで使われているどんなコードでもよいです.
例えば, -L ENG
画像を検索します 英語のテキスト, しながら -l jpn
検索します 日本語のテキスト そしてあなたも走ることができます -l jpn_vert
検索する 縦書きの日本語テキスト.
imgclipはTesseractに大きく依存しているので、基本的にはあなたが自由に使えるそのライブラリ全体の力を持っています。.
に 始めましょう, GitHubページにアクセスしてローカルにコピーをダウンロードするか、npm経由で特定のディレクトリにインストールしてください。その後、アプリケーションのように端末でツールを実行できます。 あなたが望む任意の画像を解析する.
見る 実行中のimgclip, imgclipデモとして作成されたこの短いビデオをご覧ください。.