安装和加载rpart包
# 安装并加载rpart包
install.packages("rpart")
library(rpart)
创建数据集
# 创建一个简单的分类数据集
set.seed(123)
data <- data.frame(
Age = runif(100, 18, 65),
Income = rnorm(100, mean = 50000, sd = 10000),
CreditScore = runif(100, 300, 850),
Approval = sample(c("Yes", "No"), 100, replace = TRUE)
)
构建决策树模型
# 使用rpart函数构建决策树模型
decision_tree_model <- rpart(Approval ~ Age + Income + CreditScore, data = data, method = "class")
在上述代码中,我们使用了一个简单的数据集,包含了年龄(Age)、收入(Income)、信用分数(CreditScore)和批准与否(Approval)的信息。然后,我们使用rpart函数构建了一个分类决策树模型,其中method = "class"表示进行分类。
可视化决策树
# 安装并加载rpart.plot包
install.packages("rpart.plot")
library(rpart.plot)
# 可视化决策树
rpart.plot(decision_tree_model, nn = TRUE, type = 4, fallen.leaves = TRUE)
上述代码中,我们使用了rpart.plot包中的rpart.plot函数来可视化构建的决策树。
决策树的节点上显示了分裂的条件,叶节点上显示了类别预测。在实际应用中,你可以根据你的数据和问题调整模型参数,进行交叉验证等来优化决策树模型。
转载请注明出处:http://www.pingtaimeng.com/article/detail/6426/R语言