久しぶりに Google のウェブマスターツールを見てたらはてなブログの sitemap.xml が「保留」になってました。
気づいたのがちょうど0時前後だったので6月19日と6月20日で確認してみると sitemap.xml には当日分のデータしか載ってませんでした。
暫くブログを書いていなかったせいかな?と思って色々見ていると「ブロックされた URL」でサイトマップの URL が sitemap.xml ではなく sitemap_index.xml になっていることを発見。
User-agent: * Sitemap: http://mattintosh.hatenablog.com/sitemap_index.xml Disallow: /api/
登録したときに間違ったのかと思ってググってみるとはてなブログのサイトマップは sitemap.xml が圧倒的。
気になったので sitemap_index.xml もググってみましたが、今日の段階では「200件」でした。
2つ目の検索結果(このフィードバック)に書いてありますがはてなブログは sitemap_index.xml だそうです。
sitemap.xml でもOKだったけどいつの間にか仕様が変わって使えなくなったんですかね。とりあえず最初の画像のように sitemap_index.xml を Google に再送信しておいたところきちんと再登録されました。
追記:後日確認したところ sitemap.xml と sitemap_index.xml 両方とも認識されていました。よく見たら種別が「サイトマップインデックス」になってました。
Google ウェブマスターツールのヘルプ によると、
サイトマップ インデックス ファイルを作成したら、保存して、Google に送信します。サイトマップをすべてアップロードし、保存していれば、個々のサイトマップを送信する必要はありません。サイトマップ インデックス ファイルを送信するだけで十分です。アカウントのサイトごとにサイトマップ インデックス ファイルを 500 ファイルまで送信できます。
と、あるので XML の内容が当日分だけで短いのはそれがインデックスファイルだったからでした。保留だった理由はわかりませんが。