网站首页 > 教程文章 正文
1.创建新的变量:transform() 函数允许你为现有的数据框添加新的列,或者修改现有列的值,而不需要改变数据集原有的行和列的结构。
library(dplyr)
假设我们有一个名为 df 的数据框
df <- data.frame(
x = c(1, 2, 3),
y = c(4, 5, 6)
)
使用 transform() 为 df 添加一个新列 z,z 是 x 和 y 的和
df <- transform(df, z = x + y)
查看修改后的数据框
print(df)
--------------
x y z
1 1 4 5
2 2 5 7
3 3 6 9
2.变量的重编码
library(dplyr)
df <- data.frame(
x = c(1, 2, 3),
y = c(4, 5, 6)
)
#将大于2的数字重编码为small
df$x[df$x>2] <- "small"
print(df)
-----------------
x y
1 1 4
2 2 5
3 small 6
3.变量的重命名
library(dplyr)
df <- data.frame(
x = c(1, 2, 3),
y = c(4, 5, 6)
)
names(df)[2] <- "z"
print(df)
-----------------
x z
1 1 4
2 2 5
3 3 6
4.缺失值
4.1 识别缺失值
library(dplyr)
df <- data.frame(
x = c(1, 2, 3),
y = c(4, 5, NA)
)
is.na(df$y)
-----------------
[1] FALSE FALSE TRUE
4.2 重编码为缺失值
library(dplyr)
df <- data.frame(
x = c(1, 2, 3),
y = c(0, 5, NA)
)
df$y[df$y==0] <- NA
print(df)
-----------------
x y
1 1 NA
2 2 5
3 3 NA
4.3 在分析中排除缺失值
x <- c(1, 2, 3)
y <- c(0, 5, NA)
z <- x+y
print(z)
---------
#含有缺失值的算术表达式和函数的计算结果也为缺失值
[1] 1 7 NA
x <- c(1, 2, 3)
y <- c(0, 5, NA)
z <- sum(x+y, na.rm=TRUE)
print(z)
---------
#na.rm=TRUE移除缺失值,使用剩余的值计算
[1] 8
df <- data.frame(
x = c(1, 2, 3),
y = c(0, 5, NA)
)
df2 <- na.omit(df)
print(df2)
---------
#na.omit()删除所有含有缺失数据的行
x y
1 1 0
2 2 5
- 上一篇: print内置函数
- 下一篇: 看完这个「R语言课程」合集,我发现R语言也不过如此…
猜你喜欢
- 2025-01-21 Python中的“锁”艺术:解锁Lock与RLock的秘密
- 2025-01-21 Python格式化字符串
- 2025-01-21 Lua实现文件I/O操作,你会吗?
- 2025-01-21 Python调用易语言动态链接库,实现验证码通杀例子
- 2025-01-21 Python语言入门源代码
- 2025-01-21 R 语言 + aardio 快速开发图形界面、生成独立 EXE
- 2025-01-21 Python中定义函数
- 2025-01-21 Python基础语法之print和变量赋值
- 2025-01-21 java程序设计练习题(二)附答案
- 2025-01-21 c#中使用miniExcel和fastreport实现付款审批单的批量打印
- 最近发表
- 标签列表
-
- location.href (44)
- document.ready (36)
- git checkout -b (34)
- 跃点数 (35)
- 阿里云镜像地址 (33)
- qt qmessagebox (36)
- md5 sha1 (32)
- mybatis plus page (35)
- semaphore 使用详解 (32)
- update from 语句 (32)
- vue @scroll (38)
- 堆栈区别 (33)
- 在线子域名爆破 (32)
- 什么是容器 (33)
- sha1 md5 (33)
- navicat导出数据 (34)
- 阿里云acp考试 (33)
- 阿里云 nacos (34)
- redhat官网下载镜像 (36)
- srs服务器 (33)
- pico开发者 (33)
- https的端口号 (34)
- vscode更改主题 (35)
- 阿里云资源池 (34)
- os.path.join (33)