本ページ内での定義

 df = DataFrame
 Val = Variables 連続値
 Gval = Grouping variables グループ分けして視認可能な 離散値 | オブジェクト

ライブラリの読み込み

import pandas as pd
pd.plotting.register_matplotlib_converters() # datetime型のデータを扱う場合
import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns
print("Setup Complete")

共通パラメータ

 data = pandas.DataFramenumpy.ndarray, mapping, or sequence
 x, y = vectors or keys in data
 hue = Gvalを色合いで区別
 legend = 凡例 “auto”, “brief”, “full”, or False

散布図

sns.relplot()  x=Val, y=Val
 size = Valの量をマーカーの大きさで表現
 style = Gvalをマーカーで区別(●×■◆▲…)
 col = Gval毎にsubplotを生成
 col_wrap = 1行毎のsubplotの数

sns.relplot(data=df, x="Val", y="Val", hue="Gval", size="Val", style="Gval", col="Gval", col_wrap=num)

sns.scatterplot()  x=Val, y=Val
 size = Valの量をマーカーの大きさで表現
 style = Gvalをマーカーで区別(●×■◆▲…)

plt.figure(figsize=(12,6))
sns.scatterplot(data=df, x="Val", y="Val", hue="Gval", size="Val", style="Gval")

折れ線グラフ

sns.lineplot()  x=Gval, y=Val
  style = Gvalをマーカーで区別(●×■◆▲…)
  markers = True / False(None) マーカーの表示 / 非表示
  dashes = True / False(None) Gval毎に線種を変える / 変えない
  err_style* = “band” / “bars” / None 誤差範囲を 範囲表示 / 縦線表示 / 非表示

plt.figure(figsize=(12,3))
sns.lineplot(data=df, x="Gval", y="Val", hue="Gval", style="Gval", markers=boolean, dashes=boolean, err_style=None*)

複合

sns.displot()  x=Val, y=Val

 kind = “hist”(ヒストグラム) / “ecdf”(経験的累積分布関数)
 kde = True kde(カーネル密度推定) 追加表示

sns.scatterplot(data=df, x="Val", y="Val", hue="Gval", kind="hist/ecdf", kde=boolean)

ヒストグラム

sns.histplot()  x, y = Val / Gval

 bins = num x軸の分割数
 multiple* = layer / stack / fill / dodge 

plt.figure(figsize=(12,3))
sns.histplot(data=df, x/y="Val/Gval", hue="Gval", bins=20, multiple="stack"*)