【はてなブログのsitemapについての調査】調べてみたら中身が書かれているのは「sitemap.xml?page=1」という結果に※追記あり2019.06.16
サイトマップが読み込まれない!
Google サーチコンソールにサイトマップを登録したはずなのに何故かキチンと処理されていないということが分かりました。
調べてみると、はてなブログ関連でsitemapが正常に処理されないという話はあちらこちらで起きている現象の様です。
そこで今回はどうやったらサイトマップをグーグルサーチコンソールに登録できるのかを検証してみたいと思います。
まず現状の確認
グーグルサーチコンソールの中にある「カバレッジ」というメニューから、ブログ記事がGoogleにどれぐらい登録されているかが見れます。
結果
インデックス登録されていましたが、サイトマップに送信していません
と表示されています。
これはおそらく、グーグルのクローラーが勝手に記事を見つけてインデックス登録してくれただけであって、やはりサイトマップはきちんと処理されていない様子です。
サイトマップの中に書かれている内容について調べてみる
4つのサイトマップを登録してみましたが、実際に重要なのは、その中にきちんとした内容が書かれているかどうかです。
これについてはネット上の情報があやふやなものばかりだったので、実際に1つずつ調査してみました。
結論:いろいろ書かれているのは「sitemap.xml?page=1」のみ
調べた結果「sitemap.xml?page=1」のみが中身に色々書かれており、これが登録されないことには意味が無いということが分かりました。
ネットの上の記事では、複数登録したサイトマップは1週間ぐらいしたら取得完了となるとのことでしたのでしばらく待ってみようと思います。
うまく取得してくれると良いのですが……
2019/5/21 追記
やはり現状は変わらず。
sitemap.xmlだけは読み込まれている模様。
一方カバレッジを見る限り、自動クロールによってインデックス登録はされているらしい。
以下の記事にある様に、はてなブログでは別にサイトマップが機能していなくてもページURLはほぼインデックス登録されるらしいとのこと。
1つ確認していただきたいのは、Search Console のカバレッジでサイトがインデックスされているかどうかです。
Googlebot が URL を検出するのは2通りあって、ページへのリンクと サイトマップ です。仮にサイトマップがなかったとしても、Googlebot がページを辿って URL が検出できるサイト構造になっているのであれば、問題は発生しませんのでご安心ください。
URLがインデックスされているのであれば、あまり気にしなくてもいいのかなと思います
はてなブログのsitemap.xmlを送信しても「サイトマップを読み込めませんでした」となる - Search Console Community
なおこのサイトマップが読み込まれない問題は他のブログでも発生しているとのこと
【問い合わせ】はてなブログのサイトマップの不具合について【初心者必見】 - 僕は【戯れ記事《ゴト》遣い】