编辑代码

## CH3

## 3.1 summary statistics

# 构造数据集
eggs <- c (5, 11, 9, 7, 6, 11, 7, 8, 3, 14, 6, 9, 9, 7, 9)

# 计算min max Q1 median mean Q3 
summary(eggs)

# 计算其他数字特征
mode(eggs) # 众数
# skew(eggs) # 偏度系数,需要安装psych包才可以调用skew函数

# 3.2 working directory

# 获取当前工作路径
getwd()
setwd("/home/code")
getwd()

# 3.4 import data and dataframe
 
# R 内置数据库
#iris 

# 查看数据
#View(iris)

# 查看数据类型
class(iris$Sepal.Width)

# 数据索引
iris$Sepal.Width[1:2]

# 怎么不用$来获取列
attach(iris) # 指定数据集
Sepal.Width[1:2] # 制定后可以直接用列名调用
detach(iris) # 取消指定

# 3.5 Bivariate data

# 计算相关系数
attach(iris)
cor(Sepal.Width,Sepal.Length)

# 3.6 Summary

# 其他useful函数
sd(Sepal.Width) # 计算标准差
var(Sepal.Width) # 计算方差
sd(Sepal.Width)**2 == var(Sepal.Width) # 方差为标准差平方
Sys.Date() # 返回当前日期
format(Sys.Date(),"%d %B,%Y") # 指定日期格式