なろう分析記録

『小説家になろう』をふくめ『ネット小説投稿サイト』を分析する。コード置き場,主にPython,javascript,たまに創作。

なろう作品の書籍化情報を全取得するPythonコード

書籍化情報をエクセルファイルに落とし込む

なろう作品の書籍化情報を全部まとめて1つのエクセルファイルに落とし込むPythonコードを書きましたので公開したいと思います。

f:id:karupoimou:20190704003849p:plain:w400
出力ファイルの例

2019-10-02 追記:
Pythonコードをなろう書報ページにリニューアルに対応しました。

仕組み

小説家になろう公式サイトの「出版作品紹介ページ」に載っている情報をスクレイピングで取得します。

f:id:karupoimou:20190702220648p:plain:w400
出版作品紹介ページ
https://syosetu.com/syuppan/list/

※なお、この出版作品紹介は著者本人の申請によって掲載されるので、申請がなされていない書籍化作品については情報取得できませんのでご了承ください(ただその様な作品はほとんど無いと思われます)

f:id:karupoimou:20190702222341p:plain:w400
書報掲載申請ページ

準備

pip

pip install beautifulsoup4
pip install pandas
pip install tqdm

取得コード

Github:
gist59ace5718f25e8948b2964acab4d42fe

※バグの修正と項目の追加を行いました(2019/07/03 18:00)

出力例

Pythonコードを実行すると実行ファイルの同ディレクトリに「なろう書籍化情報.xlsx」が生成されます(すでにファイルが存在する場合は上書きされますのでご注意ください)

f:id:karupoimou:20190702220836p:plain
出力されるファイル