您的当前位置：首页数据挖掘常用模型构建示例_光环大数据 Python培训机构

数据挖掘常用模型构建示例_光环大数据 Python培训机构

来源：乌哈旅游

光环大数据--大数据培训&人工智能培训

http://hadoop.aura-el.com 数据挖掘常用模型构建示例_光环大数据 Python培训机构

Linear Regression

library(MASS)lm_fit = lm(medv~poly(rm,2)+crim,data = Boston) # 构建线性模型summary(lm_fit) # 检查线性模型

Ridge Regreesion and Lasso

# 岭回归与lasso回归跟其他模型不同，不能直接以公式的形式把数据框直接扔进去，也不支持subset；所以数据整理工作要自己做

library(glmnet)library(ISLR)Hitters = na.omit(Hitters)x = model.matrix(Salary~., Hitters)[,-1] # 构建回归设计矩阵y =

Hitters$Salaryridge.mod = glmnet(x,y,alpha = 0,lambda = 0.1) # 构建岭回归模型lasso.mod = glmnet(x,y,alpha = 1,lambda = 0.1) # 构建lasso回归模型

Logistic Regression

library(ISLR)train = Smarket$Year<2005logistic.fit =

glm(Direction~Lag1+Lag2+Lag3+Lag4+Lag5+Volume,data=Smarket,family=binomial, subset=train) # 构建逻辑回归模型glm.probs = predict(glm.fit,newdata=Smarket[!train,],type=\"class\")

K-Nearest Neighbor

光环大数据 http://hadoop.aura.cn

光环大数据--大数据培训&人工智能培训

http://hadoop.aura-el.com library(class)library(ISLR)standardized.X=scale(Caravan[,-86]) # 先进行变量标准化test <- 1:1000train.X <- standardized.X[-test,]train.Y <- Caravan$Purchase[-test]test.X <- standardized.X[test,]test.Y <- Caravan$Purchase[test]knn.pred <- knn(train.X,test.X,train.Y,k=3) # 直接给出测试集预测结果

Naive Bayse

library(e1071)classifier<-naiveBayes(iris[,c(1:4)],iris[,5]) # 构建朴素贝叶斯模型table(predict(classifier,iris[,-5]),iris[,5]) # 应用朴素贝叶斯模型预测

Decision Tree

library(tree)library(ISLR)attach(Carseats)High = ifelse(Sales <= 8 ,\"No\

sample(1:nrow(Carseats),200)Carseats.test = Carseats[-train,]High.test = High[-train]tree.carseats = tree(High~.-Sales,Carseats,subset=train) # 建立决策树模型summary(tree.carseats)# 可视化决策树plot(tree.carseats)text(tree.carseats,pretty = 0)

Random Forest

library(randomForest)library(MASS)train =

sample(1:nrow(Boston),nrow(Boston)/2)boston.test =

Boston[-train,]rf.boston = randomForest(medv~.,data = Boston,subset = train,mtry=6,importance=T)rf.bostonsummary(rf.boston)

Boosting

光环大数据 http://hadoop.aura.cn

光环大数据--大数据培训&人工智能培训

http://hadoop.aura-el.com library(gbm)library(MASS)train =

sample(1:nrow(Boston),nrow(Boston)/2)boston.test = Boston[-train,]boost.boston = gbm(medv~.,data = Boston[train,],distribution =

\"gaussian\.boston)

Princpal Content Analysis

library(ISLR)pr.out = prcomp(USArrests,scale. = T)pr.out$rotationbiplot(pr.out,scale = 0)

Apriori

library(arules) #加载arules程序包data(Groceries) #调用数据文件frequentsets=eclat(Groceries,parameter=list(support=0.05,maxlen=10)) #求频繁项集inspect(frequentsets[1:10]) #察看求得的频繁项集

inspect(sort(frequentsets,by=\"support\")[1:10]) #根据支持度对求得的频繁项集排序并察看（等价于inspect(sort(frequentsets)[1:10]）

rules=apriori(Groceries,parameter=list(support=0.01,confidence=0.01)) #求关联规则summary(rules) #察看求得的关联规则之摘要

x=subset(rules,subset=rhs%in%\"whole milk\"&lift>=1.2) #求所需要的关联规则子集inspect(sort(x,by=\"support\")[1:5]) #根据支持度对求得的关联规则子集排序并察看

K-means and Hierarchical Clustering

library(ISLR)nci.labels = NCI60$labsnci.data = NCI60$datasd.data = scale(nci.data)data.dist = dist(sd.data)# k-meanskm.out =

光环大数据 http://hadoop.aura.cn

光环大数据--大数据培训&人工智能培训

http://hadoop.aura-el.com kmeans(sd.data,4,nstart = 20)# Hierarchical Clustering hc.out = hclust(dist(sd.data))plot(hc.out,labels = nci.labels)

Support Vector Machine

library(e1071)library(ISLR)dat = data.frame(x = Khan$xtrain,y = as.factor(Khan$ytrain))out = svm(y~.,data = dat, kernel = \"linear\cost = 10)summary(out)

Artificial Neural Network

library(AMORE)x1 <- round(runif(2000,1,2000)) #随机生成2000个数x2 <- round(runif(2000,1,2000)) x11 <-

scale(x1[1:1900]) #数据标准化，并选取1900个组作为学习集x12 <- scale(x2[1:1900]) x21 <-

scale(x1[1901:2000]) #选取100组作为待测集x22 <- scale(x2[1901:2000])y1 <- x11^2+x12^2y2 <-x21^2+x22^2p <-cbind(x11,x12) #整合为矩阵q <-cbind(x21,x22)target =

y1net<-newff(n.neurons=c(2,2,1),learning.rate.global=1e-2,momentum.gl

obal=0.4,error.criterium=\"LMS\output.layer=\"purelin\

target,error.criterium=\"LMS\<- sim(result$net, q) #对待测集进行预测plot(q[1:100,1],z, col=\"blue\画出待测集模型运算后的图形points(q[1:100,1],y2,col=\"red\pch=\"x\") #画出待测集图形，并比较两者之间的差异。

数据挖掘&数据分析

光环大数据 http://hadoop.aura.cn

光环大数据--大数据培训&人工智能培训

http://hadoop.aura-el.com 为什么大家选择光环大数据！

大数据培训、人工智能培训、Python培训、大数据培训机构、大数据培训班、数据分析培训、大数据可视化培训，就选光环大数据！光环大数据，聘请大数据领域具有多年经验的讲师，提高教学的整体质量与教学水准。讲师团及时掌握时代的技术，将时新的技能融入教学中，让学生所学知识顺应时代所需。通过深入浅出、通俗易懂的教学方式，指导学生较快的掌握技能知识，帮助莘莘学子实现就业梦想。

光环大数据启动了推进人工智能人才发展的“AI智客计划”。光环大数据专注国内大数据和人工智能培训，将在人工智能和大数据领域深度合作。未来三年，光环大数据将联合国内百所大学，通过“AI智客计划”，共同推动人工智能产业人才生态建设，培养和认证5-10万名AI大数据领域的人才。

参加“AI智客计划”，享2000元助学金！

【报名方式、详情咨询】

光环大数据网站报名：http://hadoop.aura-el.com 手机报名链接：http:// hadoop.aura-el.com /mobile/

光环大数据 http://hadoop.aura.cn

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文