Googleがメタタグを使用してコンテンツにインデックスを付ける方法を制御する

検索エンジンはたくさんありますが、ほとんどの場合、サイトの所有者は自分のサイトを全能のGoogleでインデックスに登録することを好みます。検索エンジンのパフォーマンスを向上させる1つの方法は、 メタロボットタグを使用する.

の メタ ロボットタグは、Google、Yahoo、Bingなどの検索エンジン間で一致するメタタグです。メタタグを使用すると、Web開発者は検索エンジンのクローラに対してWebページのアクセシビリティを制御できます。例えば、 インデックスなし 検索エンジンからのすべてのロボットがあなたのWebページをインデックスに入れないようにします。.

グーグル自身のロボットはグーグルボットと呼ばれる。この記事では、Googlebotへの独占的な対応方法について説明します。 メタタグ.

Googlebotへの対応

Googlebotをアドレス指定するには、メタを指定します 名 として グーグルボット ただの代わりに ロボット. この例では、GooglebotがWebページをインデックスに登録するのを防ぎますが、それでもBingとYahooのボットがそのページをクロールできるようにします。したがって、あなたのウェブページはまだBingとYahooの検索結果に表示されるかもしれません。.

Googleには、Image、News、Video、Ads、Mobileなど、さまざまな種類のコンテンツをクロールする特殊なロボットが多数あります。 Googleでは、これらのロボットを個別にブロックすることができます。たとえば、WebサイトをGoogle Mobileの検索結果に表示したくない場合は、次のようにメタロボットタグを指定できます。

Googleのボットタイプの全リストは、Googleのウェブサイトクローラのページにあります。.

画像のインデックス作成を防止する

あなたの著作権で保護された画像があなたの事前の許可なしに他の誰かによって使用されているのを見つけたときそれは本当にいらいらします。これを最小限に抑えたい場合は、Googleが自分の画像をインデックスに登録しないようにすることができます。.

次の値でメタロボットタグを指定します。 noimageindex. これにより、ロボットがページ内のすべての画像にインデックスを付けるのを防ぎ、あなたの画像がGoogle画像検索の結果に表示されなくなります。.

あるいは、メタ名を次のように設定できます。 googlebot-image Googleのロボットが画像のためにサイトをクロールするのを特に防ぐため.

翻訳を禁止する

Google Chromeは、Google Translateを使用して、訪問者のお気に入りまたは現地の言語への外国語のサイトの翻訳を提供します。 Google翻訳の翻訳は向上していますが、一部の言語では完全には程遠いものです。翻訳の出力は時々本当に風変わりです.

GoogleにWebページを翻訳させたくない場合は、googlebotメタを次の値に設定します。 翻訳しない, そのようです.

ページの特定のセクションが翻訳されないようにしたい場合は、 翻訳しない コンテンツをラップする要素内のクラス：

Googleはこれを無視します

完全に.

指定した時間が経過した後にインデックスを作成しない

また、Googleが一定期間後にWebページをインデックスに登録しないようにすることもできます。これは、例えばイベント登録ページのように、時間枠内でのみ関連するWebページに特に役立ちます。.

この場合は、イベントの終了後にこのページをクロールしてインデックスに登録しないようにロボットに指示して、Googleの検索結果に表示されないようにすることをお勧めします。.

これを行うには、metaタグを次の値で指定します。 unavailable_after その後、時間情報が続きます。時間形式はRFC-850形式に準拠している必要があります。例えば、木曜日、26-Sep-14 10:00:00 UTC

上記の例では、Googleロボットは14-Sep-14以降にページをクロールしません。ページは最終的にインデックスから消えますが、それでもウェブサイトでアーカイブするためにページを保持することはできます.