2011年4月23日土曜日

R入門01

> 2+4
[1] 6

 

> 20/5
[1] 4

 

> sqrt(200)
[1] 14.14214

 

なんか便利な関数があるアルヨてな話

> summary(c(173,178,180,183,182,174,179,179,174,192))
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
  173.0   175.0   179.0   179.4   181.5   192.0

 

変数に代入するのにいちいち<-ていう演算子ぶち込まないといけないよねてな話

> 身長 <- c(173,178,180,183,182,174,179,179,174,192)
> 身長
[1] 173 178 180 183 182 174 179 179 174 192

 

でこいつは本には書いてなかったのだが、一回代入すると、多分ソフトを再起動させるか、同じ変数名に別の数値を代入しない限り、その値は保持されるみたい。

> 身長 <- c(173,178,180,183,182,174,179,179,174,192)
> 身長
[1] 173 178 180 183 182 174 179 179 174 192
> sqrt(身長)
[1] 13.15295 13.34166 13.41641 13.52775 13.49074 13.19091 13.37909 13.37909
[9] 13.19091 13.85641
> summary(身長)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
  173.0   175.0   179.0   179.4   181.5   192.0

 

ここで発見したこと。どうやらこの言語には予約語という概念は存在しないらしい。

要するにsqrt(sqrt)ということも、sqrtという変数に正のsqrt関数有効範囲内の数値が代入されていれば有効であるということだ。

なんとも中途半端な言語だなあ。本当に使っていて大丈夫なのか?これ?

> matrix <- matrix(c(173,178,180,183,182,174,179,179,174,192,17000,14000,9000,50000,30000,12000,900,2100,1000,25000),10,2)
> matrix
      [,1]  [,2]
[1,]  173 17000
[2,]  178 14000
[3,]  180  9000
[4,]  183 50000
[5,]  182 30000
[6,]  174 12000
[7,]  179   900
[8,]  179  2100
[9,]  174  1000
[10,]  192 25000

で、このmatrix(c(x,y,・・・・・)n,m)

これでnm行列の作成と言うところだね。

まあ、統計言語としちゃあ仕方ないんだけど、俺的には配列変数を応用してやったほうが直感的で使い良いと思うんだけどね。

Image111

test.csvの中身

> hoks <- read.csv("test.csv")
> hoks
    X height salary
1   1    173  17000
2   2    178  14000
3   3    180   9000
4   4    193  50000
5   5    182  30000
6   6    174  12000
7   7    179    900
8   8    179   2100
9   9    174   1000
10 10    192  25000

csvファイルから直接読み込めるのはちょっと便利かもね。



0 件のコメント:

コメントを投稿