2017年12月16日土曜日

学習環境

Head Firstデータ解析 (Michael Milton (著)、大橋 真也 (監訳)、 木下 哲也 (翻訳)、オライリージャパン)の10章(回帰 - 予測)、既成のRコード(p. 301)を取り組んでみる。

既成のRコード(p. 301)

コード(Emacs)

R言語

#!/usr/bin/env Rscript

url <- "http://www.oreilly.co.jp/pub/9784873114644/hfda_ch10_employees.csv"
employees <- read.csv(url, header=TRUE)
head(employees,n=30)

## cor関数は相関係数(correlation coefficient)
## employees$requested(要求率) employees$negotiated==TRUE(交渉した人)
## employees$received(受取率) employees$negotiated==TRUE(交渉した人)
cor(employees$requested[employees$negotiated==TRUE],
    employees$received[employees$negotiated==TRUE])
                        
svg('sample3.svg')
plot(employees$requested[employees$negotiated==TRUE],
     employees$received[employees$negotiated==TRUE])

入出力結果(Terminal)

$ ./sample3.r
    X received requested negotiated gender year
1   1     12.1       9.5       TRUE      M 2005
2   2      8.9       9.9       TRUE      F 2006
3   3      8.8      18.1       TRUE      M 2007
4   4      7.1      11.8       TRUE      F 2008
5   5     10.2      12.5       TRUE      M 2009
6   6      7.0      10.2       TRUE      F 2005
7   7     15.1       9.3       TRUE      M 2006
8   8     16.0      10.7       TRUE      F 2007
9   9      8.2      11.4       TRUE      M 2008
10 10     10.5      15.0       TRUE      F 2009
11 11      1.9       4.4       TRUE      M 2005
12 12      9.7      13.4       TRUE      F 2006
13 13      9.9      10.1       TRUE      M 2007
14 14     13.4       9.0       TRUE      F 2008
15 15      8.6      10.3       TRUE      M 2009
16 16      5.3      13.8       TRUE      F 2005
17 17     16.5      11.6       TRUE      M 2006
18 18     11.2      15.9       TRUE      F 2007
19 19      8.4       7.8       TRUE      M 2008
20 20     14.9      13.2       TRUE      F 2009
21 21     14.6      10.5       TRUE      M 2005
22 22      2.7       8.9       TRUE      F 2006
23 23      8.6       8.1       TRUE      M 2007
24 24      8.0      11.9       TRUE      F 2008
25 25     16.4      17.9       TRUE      M 2009
26 26     14.1      15.6       TRUE      F 2005
27 27     10.2      10.1       TRUE      M 2006
28 28     19.7      12.7       TRUE      F 2007
29 29      6.8       8.2       TRUE      M 2008
30 30      7.6       7.4       TRUE      F 2009
[1] 0.6656481
$

0.5より大きく、少し相関がある。

0 コメント:

コメントを投稿