安装和加载randomForest包
# 安装并加载randomForest包
install.packages("randomForest")
library(randomForest)
创建数据集
# 创建一个简单的分类数据集
set.seed(123)
data <- data.frame(
Age = runif(100, 18, 65),
Income = rnorm(100, mean = 50000, sd = 10000),
CreditScore = runif(100, 300, 850),
Approval = sample(c("Yes", "No"), 100, replace = TRUE)
)
构建随机森林模型
# 使用randomForest函数构建随机森林模型
random_forest_model <- randomForest(Approval ~ Age + Income + CreditScore, data = data)
在上述代码中,我们使用了一个简单的数据集,包含了年龄(Age)、收入(Income)、信用分数(CreditScore)和批准与否(Approval)的信息。然后,我们使用randomForest函数构建了一个随机森林分类模型。
查看随机森林模型的重要变量
# 查看随机森林模型的变量重要性
varImpPlot(random_forest_model)
上述代码中,我们使用了varImpPlot函数来查看随机森林模型的变量重要性。这个图表显示了每个变量的相对重要性。
随机森林是一种强大的机器学习算法,通常在分类和回归问题上表现良好。在实际应用中,你可以根据你的数据和问题进行适当的调整,如调整树的数量、深度等参数,以获得更好的模型性能。
转载请注明出处:http://www.pingtaimeng.com/article/detail/6427/R语言