なろう分析記録

『小説家になろう』をふくめ『ネット小説投稿サイト』を分析する。コード置き場,主にPython,javascript,たまに創作。

【Pythonサンプルコード】なろう全作品情報一括取得ファイルに『作者』に関する集計項目を追加するPythonコード

以前、全なろう作品の情報を全項目・全取得が入ったエクセルファイルを出力するPythonコードをご紹介しました。

 

karupoimou.hatenablog.com

 

今回は、そのコードで出力したエクセルファイルに対して「作者」に関する集計項目を新たに追加するPythonコードを紹介したいと思います。

 追加する「作者に関する項目」

今回は「作者」に関する集計項目を各作品の行に追加していきます。

 

総pt数

総ブクマ数

総感想数

総レビュー数

総評価pt数(ブクマ由来のものを含まないpt)

総評価者人数

総作品数

感想を得ている作品数

感想を得ている率

 

※感想以外の項目については単純な集計値を、感想に関する項目だけは計算として出しています。

準備

pip

pip install pandas

pip install tqdm

 tqdmは作業経過の表示に使用しています

 

f:id:karupoimou:20190915135433p:plain

プログラム

サンプルコード

 

giste7a8b174cb4b8352da412d266237ab19

 

出力したファイルの利用例

出力したファイルの項目は作者に関するデータが含まれていますので、このデータを利用することで、例えば「総文字数が多い作者はやはりpt数を多く得ているのか」などといったことを検証することが出来ます。

 

参考資料

karupoimou.hatenablog.com

 

karupoimou.hatenablog.com