R语言学习笔记(部分)
时间:2022-09-04 12:30:00
r语言入门
1.基本操作
#快捷键查询 alt shift k # 赋值 快捷键alt - x <- 3 #强赋值给全局变量<<- x <<- 3 #求和 sum(1,2,3,4,5) #平均值,mean第一个参数的平均值 mean(1,2,3,4,5) mean(c(1,2,3,4,5)) #查看已定义的变量 ls() ls.str() #查看单个变量的详细信息 str(x) # ls(all.names = TRUE) #删除不必要的变量或其值 rm(x) #删除多个 rm(a,b,x1,mtcars) #删除所有 rm(list = ls()) #清屏 Ctrl L #保存 save.image()
2.r包的安装
#R包的安装 #推荐在线安装: install.packages("vcd") #包的位置 .libPaths() #检查已安装的包 library() #一次安装多个包需要向量 install.packages(c("AER","ca")); #更新包 update.packages()
3.r包的使用
#载入包 library(vcd) require(vcd)
#r软件包的组成
#base 基础包,启动r的时候就会被包含进来
#datasets 数据集
#utils 工具包
#grDevices 图形显示兼容性,增加一些交互支持
#graphics 基于base图形的r函数
#stats
#methods 一般定义方法和类
#splines
#stats4
#tcltk
#help命令帮助使用包
help(package="vcd")
help(package="ggplot2")
library(help="vcd")
#索引
Arthritis
#列出函数
ls("package:vcd")
#数据集
data(package="vcd")
#移除加载的包
detach("package:vcd")
#从硬盘上删除包——不常用
#remove.packages("vcd")
#r包的批量移植
#列出当前环境已安装的r包
installed.packages()
#取第一列
installed.packages()[,1]
#将所有r包的名字保存到一个文件
Rpack0 <- installed.packages()[,1]
save(Rpack,file = "Rpack.Rdata")
#在另一台电脑
Rpack1 <- load(file = "Rpack.Rdata")
#批量安装(r会跳过已安装的扩展包)
for (i in Rpack1) install.packages(i)
4.获取帮助
#在菜单栏直接打开help
#使用help函数
help.start()
#常用功能package Search Engine
#查询特定函数
help(sum)
?plot
#查询函数参数
args(plot)
#使用example来查看函数功能效果
Speed <- cars$speed
Distance <- cars$dist
plot(Speed, Distance, panel.first = grid(8, 8),
pch = 0, cex = 1.2, col = "blue")
plot(Speed, Distance,
panel.first = lines(stats::lowess(Speed, Distance), lty = "dashed"),
pch = 0, cex = 1.2, col = "blue")
x <- 0:12
y <- sin(pi/5 * x)
op <- par(mfrow = c(3,3), mar = .1+ c(2,2,3,1))
for (tp in c("p","l","b", "c","o","h", "s","S","n")) {
plot(y ~ x, type = tp, main = paste0("plot(*, type = \"", tp, "\")"))
if(tp == "S") {
lines(x, y, type = "s", col = "red", lty = 2)
mtext("lines(*, type = \"s\", ...)", col = "red", cex = 0.8)
}
}
par(op)
#也有example函数
example("plot")
example("hist")
#案例图
demo(graphics)
#查询某些包的帮助函数
help(package="ggplot2")
#更规范的查询(不是所有包都有该文档)
vignette()
#使用对应的文档需要事先载入包
library("vcd")
help("vcd")
#不加载包直接查询帮助
??vcd
# 本地搜索函数
help.search("heatmap")
??heatmap
#列出包含关键字的内容
apropos("sum")
apropos("sum",mode = "function")
#网络搜索
RSiteSearch("matlab")
5.excel案例
- 一些excel的简单使用方法
6.内置数据集
help(package="datasets")
#列出数据集
data()
#使用数据集的方法:直接输入名称(可以把这些数据集看做系统定义的常量,比如Pi:π)
rivers
plot(rivers)
#一般情况下不需要对这些数据集进行赋值
#rivers <- c(1,2,3)
#常用的数据集
help(mtcars)
names(euro)
#美国州的情况
state <- data.frame(state.name,state.abb,state.area,state.division,state.region)
state
#火山区地理情况
heatmap(volcano)
#泰坦尼克成员统计
Titanic
#刹车
cars
#鸢尾花
iris
iris3
#数据集查询
data(package="MASS")
#显示所有可用的数据集
data(package=.packages(all.available = TRUE))
#单独加载数据集不加载R包
#data(<数据集名字>,package="")
data(Chile,package = "carData")
Chile
7.数据结构
#数据结构是计算机存储、组织数据的方式。 #数据类型: #1.数值型 #2.字符串 #3.逻辑型 #4.日期型 #R对象 object #R的数据结构 #1.向量,标量 #2.数组 #3.
矩阵 #……
8.向量
#向量 Vector 是构成其他数据结构的基础 向量是用于存储数值型,字符型或逻辑型数据的一堆数组
#-----
#创建向量 函数c
x <- c(1,2,3,4,5)
x
y <- c("one","two","three")
y
z <- c(T,F,T)
z
#快速构建向量
c(1:100)
seq(from=1,to=100,by=2)
#1到100内的十个等差值
seq(from=1,to=100,length.out=10)
#重复输出
rep(c(1,2,3),10)
rep(x,each=3)
rep(x,each=2,times=3)
#向量计算
y <- c(6,7,8,9,10)
x*2+y
#-----
#向量的索引
#1.正负整数索引
x <- c(1:100)
x[5]
x[-1]
x[c(4:18)]
#2.逻辑向量索引
y <- c(1:10)
y[c(T,F,T,T,F)]
y[y>5]
y[y>5 & y<9]
#3.名称索引
z <- c("one","two","three","four","five")
"one" %in% z
z["one" %in% z]
z %in% c("one","two")
k <- z %in% c("one","two")
z[k]
names(y) <- c("one","two","three","four","five","six","seven","eight","nine","ten")
y
#用名字访问向量
y["ten"]
euro["ATS"]
#-----
##修改向量
x[101] <- 101
x
v <- c(1:5)
v[20] <- 4
v
#-----
##插入元素
append(v,99,after = 4)
##删除向量
rm(v)
y <- y[-c(1:3)]
#------
#向量运算
x <- c(1:10)
x+1
y <- seq(1,100,length.out=10)
x+y
x*y
#幂运算
x**y
x^y
y;x
#取余运算
y%%x
#整除运算
y%/%x
#长度不同的向量运算
z <- c(1,2)
x+z
#长长度必须是短长度向量的背书,不然无法运算
z <- c(1,2,3)
x+z
#逻辑运算
x>5
x>y
x==y
#-----
##常用函数
#数学函数
abs(x)
sqrt(25)
log(16,2)
log10(10)
exp(x)
ceiling(-2.3)
floor(c(-2.3,4.5))
trunc(c(-2.3,4.5))
round(c(-2.3,4.5464),3)
signif(c(-2.3,4.5464),digits = 4)
sin(x)
cos(x)
#统计函数
vec <- c(1:100)
vec
sum(vec)
max(vec)
min(vec)
range(vec)
mean(vec)
#方差
var(vec)
round(var(vec),2)
#标准差
round(sd(vec),2)
#连乘
prod(vec)
#中位数
median(vec)
#分位数
quantile(vec)
quantile(vec,c(0.1,0.2,0.5,0.6))
#查询索引
t <- c(1,4,2,5,7,9,6)
which.max(t)
which(t==7)
which(t<7)
t[which(t<7)]
9.矩阵与数组
#矩阵是二维的向量
heatmap(state.x77)
x <- 1:20
m <- matrix(x,4,5)
m
#按行排列
m <- matrix(x,4,5,byrow = T)
m
rnames <- c("r1","r2","r3","r4")
cnames <- c("c1","c2","c3","c4","c5")
dimnames(m) <- list(rnames,cnames)
m
#显示向量的维数
dim(x)
#把x变成矩阵
dim(x) <- c(4,5)
x
dim(m)
#r的数组是多维的矩阵
x <- 1:20
#创建数组
dim(x) <- c(2,2,5)
x
dim1 <- c("a1","a2")
dim2 <- c("b1","b2","b3")
dim3 <- c("c1","c2","c3","c4")
z <- array(1:24,c(2,3,4),dimnames = list(dim1,dim2,dim3))
z
#矩阵的索引
m <- matrix(x,4,5,byrow = T)
m
m[1,2]
m[1,c(2,3,4)]
m[c(2,3),c(1,4)]
m["r1","c2"]
head(state.x77)
#访问整行
state.x77[,"Income"]
#访问整列
state.x77["Alabama",]
#矩阵运算
#数值矩阵与线性代数算法相同
t <- m[1,]
sum(t)
colSums(m)
rowSums(m)
rowMeans(m)
colMeans(m)
#矩阵相乘
n <- matrix(1:9,3,3)
t <- matrix(2:10,3,3)
#内积 点乘
n*t
#外积 叉乘
n %*% t
#求对角
diag(n)
n
#转置
t(n)
10.列表
#列表:列表式存储很多内容的一个集合
#列表可以存储若干向量、矩阵、数据框,甚至一些其他列表的组合
#在模式上与向量类似,列表对象是容量最大的容器
#美国每个州的经纬度
state.center
a <- 1:20
b <- matrix(1:20,4,5)
c <- mtcars
d <- "This is a test list"
mlist <- list(a,b,c,d)
mlist
mlist <- list(fisrt=a,second=b,third=c,fourth=d)
mlist
#列表的访问
mlist[1]
mlist[c(1,4)]
#查询名字:$
mlist$second
class(mlist[1])
class(mlist[[1]])
mlist[[5]] <- iris
#删除列表中的元素
mlist[[5]] <- NULL
11.数据框
#数据框是一种表格式的数据结构,数据集通常由数据构成的矩阵数组,航表示观测量,列表式变化量
#数据框实际上是列表。列表中的元素是向量,每一列长度相同,数据框的列必须命名
#创建数据框
state <- data.frame(state.name,state.abb,state.area)
#访问数据框
state[1]
state$state.area
plot(women$height,women$weight)
lm(weight ~height,data=women)
#用attach预加载不用再使用$符号
attach(mtcars)
mpg
#取消加载
detach(mtcars)
#with函数 with(<数据框名字>,[<列名称>])
12.因子
#因子,有序性变量和名义向变量,factor。这些分量的可能称之为一个水平,这些水平值构成的向量称为引子
#因子的应用:
#计算频数
#独立性检验
#相关性检验
#方差分析
#主成分分析
#因子分析
mtcars
table(mtcars$cyl)
f <- factor(c("red","red","blue","green","blue"))
f
week <- factor(c("Mon","Fri","Thu","Wed","Mon","Fri","Sun"),ordered = T,
levels = c("Mon","Tue","Wed","Thu","Fri","Sat","Sun"))
week
fcyl <- factor(mtcars$cyl)
plot(mtcars$cyl)
plot(fcyl)
num <- 1:100
cut(num,c(seq(0,100,10)))
#因子类型的数据
state.division
state.region
13.缺失数据
#缺失数据 NA存储缺失信息
#1.完全随机缺失
#2.随机缺失
#3.非随机缺失
1+NA
a <- c(NA,1:20)
sum(a)
#跳过缺失值
sum(a,na.rm = T)
mean(1:20)
mean(a,na.rm = T)
#查询是否存在缺失值 返回TRUE就存在
is.na(a)
#包已丢失,不再测试
install.packages("colorspace")
install.packages("data.table")
install.packages("VIM")
library(VIM)
RSiteSearch("VIM")
#生成没有缺失值的数据集
c <- na.omit(a)
c
is.na(c)
sum(c)
#NaN缺数数据,代表不可能的值
#lnf表示无穷 +lnf -lnf
is.nan(0/0)
14.字符串
#处理字符串的函数 #返回每个元素字符串的个数 nchar("Hello world") month.name nchar(month.name) length(month.name) nchar(c(12,2,345)) #字符串拼接函数 paste(c("Everybody","loves","stats")) paste("Everybody","loves","stats" ,sep="-") names <- c("alt","ctrl","shift"元器件数据手册
、IC替代型号,打造电子元器件IC百科大全!