ホームページ » ウェブデザイン » Tesseract.jsがイメージOCR変換をブラウザにもたらす

    Tesseract.jsがイメージOCR変換をブラウザにもたらす

    OCR翻訳はまだ完璧ではありませんが、過去数年間で劇的に改善されました。道をリードするのはTesseractです 翻訳エンジン 現在オープンソース C++.

    これは素晴らしいライブラリですが、ソフトウェアに限定されています。ありがたいことに、誰かがTesseractの移植をTesseract.jsと呼ばれるJavaScriptにしました。それ 最大60の言語をサポート それは確かに完璧ではありませんが、それはうまく仕事をします.

    インストールとセットアップはとても簡単です。 任意の画像要素をターゲットにする ページ上で Tesseract.recognize() 関数。これはどんな種類の画像でも取ることができ、それは自動的に行われます 圧縮して翻訳 ブラウザ内で.

    もっと複雑になることがありますが、美しさは 1行のコードでOCRを実行する方法.

    ライブデモを見たい場合は、Tesseract.jsランディングページをチェックしてください。これはあなたができるブラウザで正しく機能します。 自動OCR翻訳を取得するためにテキストのスキャンされた画像をドラッグ&ドロップ.

    この例をGitHubページからローカルにダウンロードすることも、CDNからTesseract.jsスクリプトを組み込むことによって独自のアプリを構築することもできます。.

    最も単純なコード例は次のようになります。 myImage HTML画像要素への直接参照です。

     Tesseract.recognize(myImage).then(function(result)console.log(result)); 

    いずれにせよ、このライブラリーはウェブ上でOCRと共に動くのにとても役に立ちます。それは完璧には程遠いですが、それも 動的なページ内OCR機能を必要とするWeb開発者のための最良のリソース.

    詳細については、Tesseract.js GitHubページにアクセスして、ライブデモをチェックしたり、オンライン資料を閲覧したりできます。.