## CH3
## 3.1 summary statistics
# 构造数据集
eggs <- c (5, 11, 9, 7, 6, 11, 7, 8, 3, 14, 6, 9, 9, 7, 9)
# 计算min max Q1 median mean Q3
summary(eggs)
# 计算其他数字特征
mode(eggs) # 众数
# skew(eggs) # 偏度系数,需要安装psych包才可以调用skew函数
# 3.2 working directory
# 获取当前工作路径
getwd()
setwd("/home/code")
getwd()
# 3.4 import data and dataframe
# R 内置数据库
#iris
# 查看数据
#View(iris)
# 查看数据类型
class(iris$Sepal.Width)
# 数据索引
iris$Sepal.Width[1:2]
# 怎么不用$来获取列
attach(iris) # 指定数据集
Sepal.Width[1:2] # 制定后可以直接用列名调用
detach(iris) # 取消指定
# 3.5 Bivariate data
# 计算相关系数
attach(iris)
cor(Sepal.Width,Sepal.Length)
# 3.6 Summary
# 其他useful函数
sd(Sepal.Width) # 计算标准差
var(Sepal.Width) # 计算方差
sd(Sepal.Width)**2 == var(Sepal.Width) # 方差为标准差平方
Sys.Date() # 返回当前日期
format(Sys.Date(),"%d %B,%Y") # 指定日期格式