なろう分析記録

『小説家になろう』をふくめ『ネット小説投稿サイト』を分析する。コード置き場,主にPython,javascript,たまに創作。

【なろう年末”誤字掃除”】今年の誤字は今年のうちに修正!なろう作品の誤字を発見しやすくサポートするPythonコード!!

年末はなろう作品の『誤字』を掃除しよう!

今年の誤字は今年のうちに修正しましょう。

しかし誤字を修正するにしても、いちいちページを開いて見直して行くのは非効率ですし、誤字は見つけようとしてもなかなか見つかりません。

そこで「なろう作者ID」を入力するだけで誤字しやすい単語や用語を強調して示すためのpythonコードを作成しましたのご紹介したいと思います。

f:id:karupoimou:20191226174724p:plain:w400
サンプル

続きを読む

【Python】Pandasでエクセルファイル(.xlsx)をDBの様に使うサンプルコード

Pythonで表データの読み出し書き出し

PythonではPandasを使うことで簡単に表計算を行うことができますが、データをファイルとして保存する場合には一工夫が必要です。

そこで今回はPandasの表データをエクセルファイル(.xlsx)に保存/読み込みするサンプルコードをご紹介したいと思います。

f:id:karupoimou:20191220020059p:plain:w400
サンプルコード

続きを読む

【Python】指定したwebページに非SSL(HTTP)画像コンテンツが存在するかどうか自動チェックするサンプルコード

はじめに

前回、【Python】なろう作品の「http://」画像の存在をチェックするサンプルコードという記事を書きましたが、よく考えてみると非SSL(HTTP)サイトからの画像引用は小説家になろうに限らず行われていることであり対応が必要です。

Flashを用いたwebサイトが段階を経て最近Google検索から検索除外扱いとなった様に、SSLサイトにおける非SSLサイトからの画像引用もそのうちSEO的に不利になるかもしれません。

www.itmedia.co.jp

なので今回は小説家になろうに限らず、指定したwebページの中に非SSL(HTTP)画像コンテンツが存在するかどうかをチェックするためのコードを紹介したいと思います。

f:id:karupoimou:20191030204318p:plain:w400
サンプルコード

続きを読む

【Python】なろう作品の「http://」画像の存在をチェックするサンプルコード

SSL(HTTP)サイトの画像は標準で表示されなくなる

画像設定項目見直しのお願い - 小説家になろうグループ公式ブログ
blog.syosetu.com

昨今、ほとんどのwebサイトでは、よりセキュリティ性の高いSSLに対応していますが、まだ一部では従来の非SSLサイトも存在します。

なので現状ではSSL化されたサイトから非SSLサイトの画像コンテンツを呼び出すことも可能となっていますが、Chromeブラウザにおいてウェブページ上の混在コンテンツを標準でブロックする予定であることが発表されました。

www.suzukikenichi.com

なので従来使えていた「ランキングタグ」や「作者マイページのプロフィール欄」での画像が「一部表示されなくなるかもしれないので各自対応をしてくださいね」というのが、今回のなろう運営からのお知らせとなっています。

対応方法としては、画像引用元のwebサイトがhttpsに対応している場合はURLに「s」を付け足すだけで大丈夫ですが、対応していない場合はimgタグを削除したり、他の場所にアップロードし直したりする必要がありそうです。

しかし大分前に投稿した作品のランキングタグ設定などを忘れている作者さんや、作品数が多くて対応が必要化どうか調べるのが大変という作者さんも多くいると思います。

そこで今回、自動で非SSLサイトの「http://画像」をチェックするPythonコードをご紹介したいと思います。

続きを読む

【Python】tweepyでRTを除外する2つの方法

RTを除外したい

ツイッターAPIを利用してツイート検索をする時、リツイート(RT)を含まないオリジナルなツイートだけを取得したい場面もあると思います。

そこで今回はいくつかのパターンに分けて、RTを除外する方法をご紹介したいと思います。

f:id:karupoimou:20191009013603p:plain:w400
取得例

続きを読む