【Pythonサンプルコード】なろう全作品情報一括取得ファイルに『作者』に関する集計項目を追加するPythonコード
以前、全なろう作品の情報を全項目・全取得が入ったエクセルファイルを出力するPythonコードをご紹介しました。
今回は、そのコードで出力したエクセルファイルに対して「作者」に関する集計項目を新たに追加するPythonコードを紹介したいと思います。
追加する「作者に関する項目」
今回は「作者」に関する集計項目を各作品の行に追加していきます。
総pt数
総ブクマ数
総感想数
総レビュー数
総評価pt数(ブクマ由来のものを含まないpt)
総評価者人数
総作品数
感想を得ている作品数
感想を得ている率
※感想以外の項目については単純な集計値を、感想に関する項目だけは計算として出しています。
準備
pip
pip install pandas
pip install tqdm
tqdmは作業経過の表示に使用しています
サンプルコード
giste7a8b174cb4b8352da412d266237ab19
出力したファイルの利用例
出力したファイルの項目は作者に関するデータが含まれていますので、このデータを利用することで、例えば「総文字数が多い作者はやはりpt数を多く得ているのか」などといったことを検証することが出来ます。
参考資料