なろう分析記録

『小説家になろう』をふくめ『ネット小説投稿サイト』を分析する。コード置き場,主にPython,javascript,たまに創作。

【Python】指定したwebページに非SSL(HTTP)画像コンテンツが存在するかどうか自動チェックするサンプルコード

はじめに

前回、【Python】なろう作品の「http://」画像の存在をチェックするサンプルコードという記事を書きましたが、よく考えてみると非SSL(HTTP)サイトからの画像引用は小説家になろうに限らず行われていることであり対応が必要です。

Flashを用いたwebサイトが段階を経て最近Google検索から検索除外扱いとなった様に、SSLサイトにおける非SSLサイトからの画像引用もそのうちSEO的に不利になるかもしれません。

www.itmedia.co.jp

なので今回は小説家になろうに限らず、指定したwebページの中に非SSL(HTTP)画像コンテンツが存在するかどうかをチェックするためのコードを紹介したいと思います。

f:id:karupoimou:20191030204318p:plain:w400
サンプルコード

続きを読む

【Python】なろう作品の「http://」画像の存在をチェックするサンプルコード

SSL(HTTP)サイトの画像は標準で表示されなくなる

画像設定項目見直しのお願い - 小説家になろうグループ公式ブログ
blog.syosetu.com

昨今、ほとんどのwebサイトでは、よりセキュリティ性の高いSSLに対応していますが、まだ一部では従来の非SSLサイトも存在します。

なので現状ではSSL化されたサイトから非SSLサイトの画像コンテンツを呼び出すことも可能となっていますが、Chromeブラウザにおいてウェブページ上の混在コンテンツを標準でブロックする予定であることが発表されました。

www.suzukikenichi.com

なので従来使えていた「ランキングタグ」や「作者マイページのプロフィール欄」での画像が「一部表示されなくなるかもしれないので各自対応をしてくださいね」というのが、今回のなろう運営からのお知らせとなっています。

対応方法としては、画像引用元のwebサイトがhttpsに対応している場合はURLに「s」を付け足すだけで大丈夫ですが、対応していない場合はimgタグを削除したり、他の場所にアップロードし直したりする必要がありそうです。

しかし大分前に投稿した作品のランキングタグ設定などを忘れている作者さんや、作品数が多くて対応が必要化どうか調べるのが大変という作者さんも多くいると思います。

そこで今回、自動で非SSLサイトの「http://画像」をチェックするPythonコードをご紹介したいと思います。

続きを読む

【Python】tweepyでRTを除外する2つの方法

RTを除外したい

ツイッターAPIを利用してツイート検索をする時、リツイート(RT)を含まないオリジナルなツイートだけを取得したい場面もあると思います。

そこで今回はいくつかのパターンに分けて、RTを除外する方法をご紹介したいと思います。

f:id:karupoimou:20191009013603p:plain:w400
取得例

続きを読む

【Pythonサンプルコード】Pandasで指定した列のユニークな要素と出現回数をリストとして取得する

ユニークな要素と出現回数をリストで取得したい

Pandasを使って指定列のユニークな要素と、それに対応する出現回数が入ったリストの作り方をご紹介します。

f:id:karupoimou:20191005212911p:plain
sample

続きを読む