なろう分析記録

『小説家になろう』をふくめ『ネット小説投稿サイト』を分析する。コード置き場,主にPython,javascript,たまに創作。

なろう作品の書籍化情報を全取得するPythonコード

書籍化情報をエクセルファイルに落とし込む

なろう作品の書籍化情報を全部まとめて1つのエクセルファイルに落とし込むPythonコードを書きましたので公開したいと思います。

f:id:karupoimou:20190704003849p:plain:w400
出力ファイルの例

2019-10-02 追記:
Pythonコードをなろう書報ページにリニューアルに対応しました。

続きを読む

はてなブログの『サイトマップが読み込まれない問題』調査の続報。『放置しておけばそのうち読み込まれる説』がおそらく正しいという結果に。

前回記事に書いた「サイトマップが読み込まれない問題」

karupoimou.hatenablog.com

前回の結論

現在のはてなブログにおける「中身の書いてあるサイトマップ」は「sitemap.xml?page=1」であった。

「sitemap.xml」には「sitemap.xml?page=1」へのリンクしか書かれていないので、「sitemap.xml」だけ読み込まれても意味がない。

しかし「sitemap.xml?page=1」を登録しても、なかなか取得されない。

なんで???

約一ヶ月後

ようやく取得成功していました。

f:id:karupoimou:20190616192051p:plain:w400
結果1

f:id:karupoimou:20190616192135p:plain:w400
結果2

最終的な結論

  • 『sitemap.xml?page=1は時間が経ったらそのうち読み込まれる説』はおそらく事実と言える。


※なお「sitemap.xml?page=1」はなかなか読み込まれないが、別ルートでクローラーがインデックス登録しているらしいので、読み込まれていなくても特に問題ないらしい。実際、読み込まれていなくても検索したらヒットする。
はてなブログのsitemap.xmlを送信しても「サイトマップを読み込めませんでした」となる - Search Console Community

【Pythonスクレイピング】なろう作品の小説情報(ポイント数・ブクマ数ect)をエクセルファイルに記録するPythonコード

なろう作品のポイント数・ブクマ数を経時的に記録する

f:id:karupoimou:20190616083137p:plain:w400
エクセルファイル

Pythonスクレイピングを用いて、なろう作品の小説情報ページにアクセスして、現在のpt数・ブクマ数・感想数・レビュー数を取得するコードです。

このコードを用いることで、経時的に小説情報を記録できますので「何時に何ポイント入ったか、何時にブクマ増えたか(あるいは減ったか)」が分かるようになります。

続きを読む

なろうR18サイトの「XID」の仕様について調べる

XIDとは

なろうアカウントを取得すると、なろう本家のIDとは別に任意でなろうR-18サイト用のアカウントであるXIDを取得できるようになります。

※なろうR18サイト=ノクターン・ムーンライト・ミッドナイトノベルズ

続きを読む

Pythonファイルをバッチファイル(.bat)から実行する方法

Pythonのスプリクトファイル(.py)をWindowsで実行する方法はいくつかありますが、

ここではその中でも、様々な応用が可能な「バッチファイル(.bat)」から.pyファイルを実行する方法を紹介したいと思います。

f:id:karupoimou:20190603165254p:plain
バッチファイル

続きを読む