plotlyでグリグリ動くインタラクティブなグラフを作りたい

Kaggle
しぃたけ
しぃたけ

Pythonのデータ可視化ライブラリ「plotly」の使い方の備忘録です。

個人的にmatplotlib,seabornより使いやすいです。

概要

背景

Pythonでグラフを書くとき、matplotlib、seabornを使うのが一般的ですが、

図示するだけの静的なグラフは描けても、データとグラフが紐づいた動的なグラフを書くことができない

という欠点があります。

この弱点を補う、動的なデータ可視化ライブラリである「plotly」を使ってみたので、使い方を残します。


環境

Windows10、Python3.6、JupyterNotebook を利用してます。


使ってみた

plotlyとは

データ可視化のためのプラットフォームです。(plotly公式

今回はPythonの使い方に絞って書きますが、Matlab、R、Juliaなどにも対応しているみたいです。

  • グラフにマウスをあてることで、データの内容を表示できる。
  • グラフのズーム、回転などがマウスでできる。

などの特徴があります。


インストール

まずはインストールしましょう。

これまで通り、pip install で対応可能です。

Anaconda環境の方はconda installで実施ください。




可視化① irisデータセット

まずは、一般的に知られているirisのデータセットを利用してデータを可視化してみます。

出力イメージ(グリグリ動かせない版)

グリグリ動くグラフはこちらhttps://cpptake.com/plotly_test/iris_plot.html


plotlyの仕様の都合上、ブラウザで見ないとグリグリ感を味わえないので、出力結果は上記のリンク先を参照ください。

(Webページ上にplotlyのグラフを載せてるページもいくつかあったんですが、誰かやり方教えていただけると嬉しいです。

出力先のグラフにマウスをあてると、

データのラベル名、最大値、最小値、n数、信頼区間など、様々な情報が表示されます。

さらに、クリック一つでズームやスライドなど簡単にできて非常に便利です。


可視化② あつもりデータセット

続いて以前記事にした、Kaggleのあつ森データセットを可視化してみます。

あつもりのデータセットについては下記の記事をご参照ください。


上記のデータを利用して、アイテムの大きさ「Size」ごとの、アイテムの売値「Sell」の値を箱ひげ図を用いて可視化してみます。

出力イメージ(グリグリ動かせない版)

グリグリ動くグラフはこちらhttps://cpptake.com/plotly_test/temp-plot.html


例によって、リンク先を参照ください。

グラフ見てみると、Sizeが 3×3 の所に明らかな外れ値が存在します。どう見ても「robot hero」のデータですね。(詳しくはあつもりの記事参照)

plotlyを使うことで、外れ値の値などもグラフ上で確認することができます。


可視化③ MRI画像の3Dマップ化

最後に、最近Kaggleで挑戦している医療用画像の可視化をplotlyを使って行ってみます。

なお、データセット、記載するコードについては、こちらにあるplotly公式リファレンスのものをまるパクリしてます。悪しからず。(plotly公式MRI画像3Dマップ化


やりたい事としては、数ミリ間隔でスライスされたMRIの画像を3次元座標上に順番に表示させていくような処理を書きたいと思います。

出力イメージ(グリグリ動かせない版)

グリグリ動くグラフはこちらhttps://cpptake.com/plotly_test/mri_plot.html


リンク先を参照いただくと、MRI画像が上から順番に流れていく3Dマップが見れるかと思います。

plotlyを使うと3次元のグラフも感覚的に動かせてすごく楽しいですね。


まとめ

インタラクティブなデータ可視化ライブラリのplotlyを使ってみました。

動的なデータ分析をしたい方にお勧めです。

自分は業務でSAS社のデータ分析ツールを利用しているのですが、plotlyはSASの仕様と似ている部分があるため、個人的には非常に使いやすいツールだと感じました。

今後は練習もかねて、matplotlib,seabornの代わりに使っていこうかと思います。

リファレンスが少ないのが課題ですが、KaggleのNotebookを見ていても、EDAをする際にplotlyを利用している人が多いと感じているので、今後増えていくと思ってます。

皆さん使っていきましょう。


コメント

  1. マルフォイ より:

    マルフォイ♪マルフォイフォイ♪

  2. がんちゃん より:

    https://cpptake.com/archives/448#toc7
    可視化① irisデータセット
    このままのソースでは動かないので

    pip3 install seaborn

    をして、

    import seaborn as sns

    をソースに記載する必要があります。

タイトルとURLをコピーしました