2019-07-02 なろう作品の書籍化情報を全取得するPythonコード プログラミング ネット小説サイト分析 書籍化情報をエクセルファイルに落とし込む なろう作品の書籍化情報を全部まとめて1つのエクセルファイルに落とし込むPythonコードを書きましたので公開したいと思います。出力ファイルの例2019-10-02 追記: Pythonコードをなろう書報ページにリニューアルに対応しました。 続きを読む
2019-06-16 はてなブログの『サイトマップが読み込まれない問題』調査の続報。『放置しておけばそのうち読み込まれる説』がおそらく正しいという結果に。 はてなブログに関するもの 前回記事に書いた「サイトマップが読み込まれない問題」 karupoimou.hatenablog.com 前回の結論 現在のはてなブログにおける「中身の書いてあるサイトマップ」は「sitemap.xml?page=1」であった。「sitemap.xml」には「sitemap.xml?page=1」へのリンクしか書かれていないので、「sitemap.xml」だけ読み込まれても意味がない。しかし「sitemap.xml?page=1」を登録しても、なかなか取得されない。なんで??? 約一ヶ月後 ようやく取得成功していました。 結果1結果2 最終的な結論 はてなブログにおける中身が書かれているサイトマップは「sitemap.xml?page=1」である。 『sitemap.xml?page=1は時間が経ったらそのうち読み込まれる説』はおそらく事実と言える。 ※なお「sitemap.xml?page=1」はなかなか読み込まれないが、別ルートでクローラーがインデックス登録しているらしいので、読み込まれていなくても特に問題ないらしい。実際、読み込まれていなくても検索したらヒットする。 はてなブログのsitemap.xmlを送信しても「サイトマップを読み込めませんでした」となる - Search Console Community
2019-06-16 【Pythonスクレイピング】なろう作品の小説情報(ポイント数・ブクマ数ect)をエクセルファイルに記録するPythonコード ネット小説サイト分析 プログラミング なろう作品のポイント数・ブクマ数を経時的に記録する エクセルファイルPythonスクレイピングを用いて、なろう作品の小説情報ページにアクセスして、現在のpt数・ブクマ数・感想数・レビュー数を取得するコードです。このコードを用いることで、経時的に小説情報を記録できますので「何時に何ポイント入ったか、何時にブクマ増えたか(あるいは減ったか)」が分かるようになります。 続きを読む
2019-06-04 なろうR18サイトの「XID」の仕様について調べる ネット小説サイト分析 XIDとは なろうアカウントを取得すると、なろう本家のIDとは別に任意でなろうR-18サイト用のアカウントであるXIDを取得できるようになります。※なろうR18サイト=ノクターン・ムーンライト・ミッドナイトノベルズ 続きを読む
2019-06-03 Pythonファイルをバッチファイル(.bat)から実行する方法 プログラミング Pythonのスプリクトファイル(.py)をWindowsで実行する方法はいくつかありますが、ここではその中でも、様々な応用が可能な「バッチファイル(.bat)」から.pyファイルを実行する方法を紹介したいと思います。バッチファイル 続きを読む