mattintosh note

どこかのエンジニアモドキの備忘録

いつの間にかはてなブログのサイトマップが取得できなくなっていた

あれ、sitemap.xml が使えない…(´・ω・`)


久しぶりに Google のウェブマスターツールを見てたらはてなブログsitemap.xml が「保留」になってました。

Google ウェブマスターツール

気づいたのがちょうど0時前後だったので6月19日と6月20日で確認してみると sitemap.xml には当日分のデータしか載ってませんでした。

はてなブログ

暫くブログを書いていなかったせいかな?と思って色々見ていると「ブロックされた URL」でサイトマップの URL が sitemap.xml ではなく sitemap_index.xml になっていることを発見。

robots.txt

User-agent: *
Sitemap: http://mattintosh.hatenablog.com/sitemap_index.xml
Disallow: /api/

登録したときに間違ったのかと思ってググってみるとはてなブログサイトマップsitemap.xml が圧倒的。

気になったので sitemap_index.xml もググってみましたが、今日の段階では「200件」でした。

Google 検索

2つ目の検索結果(このフィードバック)に書いてありますがはてなブログsitemap_index.xml だそうです。

sitemap.xml でもOKだったけどいつの間にか仕様が変わって使えなくなったんですかね。とりあえず最初の画像のように sitemap_index.xmlGoogle に再送信しておいたところきちんと再登録されました。

追記:後日確認したところ sitemap.xmlsitemap_index.xml 両方とも認識されていました。よく見たら種別が「サイトマップインデックス」になってました。

Google ウェブマスターツール

Google ウェブマスターツールのヘルプ によると、

サイトマップ インデックス ファイルを作成したら、保存して、Google に送信します。サイトマップをすべてアップロードし、保存していれば、個々のサイトマップを送信する必要はありません。サイトマップ インデックス ファイルを送信するだけで十分です。アカウントのサイトごとにサイトマップ インデックス ファイルを 500 ファイルまで送信できます。

と、あるので XML の内容が当日分だけで短いのはそれがインデックスファイルだったからでした。保留だった理由はわかりませんが。