いっかくのデータサイエンティストをいく

1からプログラミングとデータサイエンスを独習したい

【統計学】散布図(R)

2変数データの確認方法についてです。 今回も例によって有斐閣統計学」を参考にしています。

今回は2章SECTION5の「散布図」です。

データの確認

今回は上記書籍のP60にあるJリーグの試合結果のデータを使用します。 誰かの趣味でしょうか笑

wins  <- c(22, 20, 20, 18, 17, 18, 13, 13, 13, 13, 13, 13, 13, 12, 12, 5, 6, 4)
score <- c(67, 84, 80, 60, 68, 62, 51, 47, 49, 50, 57, 43, 56, 46, 42, 32, 44, 38)
lost    <- c(28, 55, 48, 41, 51, 53, 49, 45, 43, 56, 58, 55, 65, 65, 64, 56, 70, 74)

散布図を描いてみる

基本的にplot関数で書けます。plot関数についてはこちら

http://cse.naro.affrc.go.jp/takezawa/r-tips/r/48.html

が参考になります。

#勝数と得点の散布図
plot(wins, score,      #散布図の対象
        pch =16,         #シンボルの形
        cex=0.5,          #点の大きさ
        col="blue",     #点の色
        main="勝数 vs 得点",  #メインタイトル
        xlab="勝数",ylab="得点" #軸の名前
        )

f:id:imakoto0323:20180609063308p:plain

ビジュアライズの設定はこちら

http://cse.naro.affrc.go.jp/takezawa/r-tips/r/53.html

3次元の散布図はscatterplot3dを使用します。 scatterplot3dはscatterplot3dパッケージにあります。

#勝数と得点の散布図
library(scatterplot3d)
scatterplot3d(
        x=wins, y=score, z=lost,     #散布図の対象
        pch =16,                #シンボルの形
        cex=0.5,                 #点の大きさ
        col="blue",            #点の色
        main="勝数 vs 得点 vs 失点",  #メインタイトル
        xlab="勝数", ylab="得点", zlab="失点" #軸の名前
        )

f:id:imakoto0323:20180609064532p:plain

参考 https://www.kunihikokaneko.com/free/r/rscatterplot3d.html