読者です 読者をやめる 読者になる 読者になる

😃 mattintosh note 📝

Hello Raspberry Pi!

いつの間にかはてなブログのサイトマップが取得できなくなっていた

はてなブログ

あれ、sitemap.xml が使えない…(´・ω・`)


久しぶりに Google のウェブマスターツールを見てたらはてなブログの sitemap.xml が「保留」になってました。

Google ウェブマスターツール

気づいたのがちょうど0時前後だったので6月19日と6月20日で確認してみると sitemap.xml には当日分のデータしか載ってませんでした。

はてなブログ

暫くブログを書いていなかったせいかな?と思って色々見ていると「ブロックされた URL」でサイトマップの URL が sitemap.xml ではなく sitemap_index.xml になっていることを発見。

robots.txt

User-agent: *
Sitemap: http://mattintosh.hatenablog.com/sitemap_index.xml
Disallow: /api/

登録したときに間違ったのかと思ってググってみるとはてなブログのサイトマップは sitemap.xml が圧倒的。

気になったので sitemap_index.xml もググってみましたが、今日の段階では「200件」でした。

Google 検索

2つ目の検索結果(このフィードバック)に書いてありますがはてなブログは sitemap_index.xml だそうです。

sitemap.xml でもOKだったけどいつの間にか仕様が変わって使えなくなったんですかね。とりあえず最初の画像のように sitemap_index.xml を Google に再送信しておいたところきちんと再登録されました。

追記:後日確認したところ sitemap.xml と sitemap_index.xml 両方とも認識されていました。よく見たら種別が「サイトマップインデックス」になってました。

Google ウェブマスターツール

Google ウェブマスターツールのヘルプ によると、

サイトマップ インデックス ファイルを作成したら、保存して、Google に送信します。サイトマップをすべてアップロードし、保存していれば、個々のサイトマップを送信する必要はありません。サイトマップ インデックス ファイルを送信するだけで十分です。アカウントのサイトごとにサイトマップ インデックス ファイルを 500 ファイルまで送信できます。

と、あるので XML の内容が当日分だけで短いのはそれがインデックスファイルだったからでした。保留だった理由はわかりませんが。