ホームページ » の仕方 » Little Programming Skillでダウンロードスケジューラを作成する

    Little Programming Skillでダウンロードスケジューラを作成する

    私たちは皆、インターネットからものをダウンロードするのが大好きです、そして私たちがダウンロードをスケジュールするのに使用できる素晴らしいダウンロードマネージャツールの山があります。ダウンロードマネージャを使うほうが簡単かもしれませんが、Ubuntuに既に付属しているツールを調べてそれを最大限に活用することに害はありません。.

    この記事では、Ubuntuに組み込まれているソフトウェアを紹介します。 wget. その上で、Cronを使用してダウンロードをスケジュールする方法を紹介します。.

    Wgetを使ったダウンロード

    Wgetは、HTTP、HTTPS、およびFTP、最も広く使用されているインターネットプロトコルを使用してファイルを取得するためのフリーソフトウェアパッケージです。これは非対話型のコマンドラインツールなので、スクリプト、cronジョブ、X-Windowsサポートなしの端末などから簡単に呼び出すことができます。.

    端末を開いて、wgetを使ってネットからダウンロードする方法を探りましょう。 wgetによるダウンロードの基本的な構文は次のとおりです。

    wget [オプション]…[URL]…

    このコマンドはあなたのローカルドライブにwgetマニュアルをダウンロードします

    http://www.gnu.org/software/wget/manual/wget.pdf

    Linux Cron

    Ubuntuには、特定の時間に実行されるタスクをスケジュールするために使用されるcronデーモンが付属しています。 Crontabでは、実行するアクションと時間を指定できます。これは、通常コマンドラインツールを使用してタスクをスケジュールする方法です。.

    端末ウィンドウを開き、crontab -eと入力します。.

    crontabの各セクションはスペースで区切られ、最後のセクションには1つ以上のスペースがあります。クーロン項目は、分(0-59)、時(0-23、0 =真夜中)、日(1-31)、月(1-12)、平日(0-6、0 =日曜日)、コマンドで構成されています。上記のcrontabの3番目のエントリは、午前2時にwget.pdfをダウンロードします。最初のエントリ(0)と2番目のエントリ(2)は2:00を意味します。 3番目から5番目の項目(*)は、任意の時刻、月、または週を意味します。最後のエントリは、指定されたURLからwget.pdfをダウンロードするためのwgetコマンドです。.

    これがwgetの基本であり、Cronのしくみです。ダウンロードをスケジュールする方法について実際の例で略奪しましょう。.

    スケジュールダウンロード

    Firefox 3.6は午前2時にダウンロードします。ISPは限られた量のデータしか提供しないため、午前8時にダウンロードを中止する必要があります。これがセットアップの様子です。.

    上記のcrontabの最初の2つのエントリは無視してください。 3番目と4番目のコマンドは、あなたが必要とする唯一の2つのコマンドです。 3番目のコマンドは、午前2時にFirefoxをダウンロードするタスクを設定します。

    [コード]
    0 2 * * * wget -c http://download.mozilla.org/?product=firefox-3.6.6&os=win&lang=en-GB
    [/コード]

    -cオプションは、それが完了していない場合、wgetが既存のダウンロードを再開することを示します。.

    4番目のコマンドは、午前8時にwgetを停止します。 'Killall'は名前でプロセスを強制終了するunixコマンドです。.

    [コード]
    0 8 * * * killall wget
    [/コード]

    killall wgetは、Ubuntuに午前8時にwgetがファイルをダウンロードしないように指示します。.

    その他の便利なwgetコマンド

    1.ファイルをダウンロードするディレクトリを指定する

    [コード]
    wget -output-document = / home / zainul /ダウンロード/ wget manual.pdf http://www.gnu.org/software/wget/manual/wget.pdf
    [/コード]

    -output-documentオプションを使用すると、ダウンロードするファイルのディレクトリと名前を指定できます。

    Webサイトをダウンロードする

    wgetはWebサイトをダウンロードすることもできます.

    [コード]
    wget -m http://www.google.com/profiles/zainul.franciscus
    [/コード]

    上記のコマンドは私の全体のGoogleプロフィールウェブページをダウンロードするでしょう。オプション '-m'は、指定されたURLの 'ミラー'イメージをダウンロードするようにwgetに指示します。.

    もう一つの重要なオプションは、それがウェブサイトをダウンロードするときそれが続くべきであるべきリンクの数をwgetに言うことです.

    [コード]
    wget -r -l1 http://www.google.com/profiles/zainul.franciscus
    [/コード]

    上記のwgetコマンドは2つのオプションを使用します。最初のオプション '-r'は、指定されたWebサイトを再帰的にダウンロードするようにwgetに指示します。 2番目のオプション '-l1'は、指定されたWebサイトから最初のレベルのリンクのみを取得するようにwgetに指示します。 '-l2'と '-l3'の3段階まで設定できます.

    3.ロボットの侵入を無視する

    WebマスターはRobot.txtというテキストファイルを管理します。 'Robot.txt'は、wgetなどのWebページクローラがクロールしないURLのリストを管理します。 '-erobots = off'オプションを使って 'Robot.txt'を無視するようにwgetに指示することができます。次のコマンドは、私のGoogleプロフィールの最初のページをダウンロードし、 'Robot.txtを無視するようにwgetに指示します。.

    [コード]
    wget -erobots = off http://www.google.com/profiles/zainul.franciscus
    [/コード]

    別の便利なオプションは-Uです。このオプションはブラウザとしてwgetをマスクします。アプリケーションを他のアプリケーションとしてマスクすると、Webサービスプロバイダの用語およびサービスに違反する可能性があることに注意してください。.

    [コード]
    wget -erobots = off -U Mozilla http://www.google.com/profiles/zainul.franciscus
    [/コード]

    結論

    Wgetは、私たちがファイルをダウンロードするために使用できる、非常に古い学校でありながらハッキング可能なGNUソフトウェアパッケージです。 Wgetは対話型のコマンドラインツールです。つまり、アプリケーションを起動しなくても、バックグラウンドでコンピュータ上で実行させることができます。 wgetのmanページを調べてください。

    [コード]
    $ man wget
    [/コード]

    wgetで使える他のオプションを理解するため.

    リンク集

    Wgetマニュアル
    wgetが途中で失敗したときに2つのダウンロードされたファイルを結合する方法
    Linuxクイックヒント:ワンステップでのダウンロードと解凍