中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當(dāng)前位置: 首頁(yè) > news >正文

長(zhǎng)沙網(wǎng)站大全百度中心人工電話號(hào)碼

長(zhǎng)沙網(wǎng)站大全,百度中心人工電話號(hào)碼,北京云建站模板,網(wǎng)站制作com決策樹進(jìn)行鳶尾花分類的案例 背景說(shuō)明: 通過(guò)IDEA Spark 3.4.1 sbt 1.9.3 Spark MLlib 構(gòu)建鳶尾花決策樹分類預(yù)測(cè)模型,這是一個(gè)分類模型案例,通過(guò)該案例,可以快速了解Spark MLlib分類預(yù)測(cè)模型的使用方法。 依賴 ThisBuild /…

決策樹進(jìn)行鳶尾花分類的案例

背景說(shuō)明:

通過(guò)IDEA + Spark 3.4.1 + sbt 1.9.3 + Spark MLlib 構(gòu)建鳶尾花決策樹分類預(yù)測(cè)模型,這是一個(gè)分類模型案例,通過(guò)該案例,可以快速了解Spark MLlib分類預(yù)測(cè)模型的使用方法。

依賴

ThisBuild / version := "0.1.0-SNAPSHOT"  ThisBuild / scalaVersion := "2.13.11"  lazy val root = (project in file("."))  .settings(  name := "SparkLearning",  idePackagePrefix := Some("cn.lh.spark"),  libraryDependencies += "org.apache.spark" %% "spark-sql" % "3.4.1",  libraryDependencies += "org.apache.spark" %% "spark-core" % "3.4.1",  libraryDependencies += "org.apache.hadoop" % "hadoop-auth" % "3.3.6",     libraryDependencies += "org.apache.spark" %% "spark-streaming" % "3.4.1",  libraryDependencies += "org.apache.spark" %% "spark-streaming-kafka-0-10" % "3.4.1",  libraryDependencies += "org.apache.spark" %% "spark-mllib" % "3.4.1",  libraryDependencies += "mysql" % "mysql-connector-java" % "8.0.30"  
)

完整代碼

package cn.lh.spark  import org.apache.spark.ml.{Pipeline, PipelineModel}  
import org.apache.spark.ml.classification.{DecisionTreeClassificationModel, DecisionTreeClassifier}  
import org.apache.spark.ml.evaluation.MulticlassClassificationEvaluator  
import org.apache.spark.ml.feature.{IndexToString, StringIndexer, StringIndexerModel, VectorIndexer, VectorIndexerModel}  
import org.apache.spark.ml.linalg.Vectors  
import org.apache.spark.rdd.RDD  
import org.apache.spark.sql.{DataFrame, SparkSession}  /**  * 決策樹分類器,實(shí)現(xiàn)鳶尾花分類  */  //case class Iris(features: org.apache.spark.ml.linalg.Vector, label: String)  // MLlibLogisticRegression 中存在該樣例類,這里不用寫,一個(gè)包里不存在這個(gè)樣例類時(shí)需要寫object MLlibDecisionTreeClassifier {  def main(args: Array[String]): Unit = {  val spark: SparkSession = SparkSession.builder().master("local[2]")  .appName("Spark MLlib DecisionTreeClassifier").getOrCreate()  val irisRDD: RDD[Iris] = spark.sparkContext.textFile("F:\\niit\\2023\\2023_2\\Spark\\codes\\data\\iris.txt")  .map(_.split(",")).map(p =>  Iris(Vectors.dense(p(0).toDouble, p(1).toDouble, p(2).toDouble, p(3).toDouble), p(4).toString()))  import spark.implicits._  val data: DataFrame = irisRDD.toDF()  data.show()  data.createOrReplaceTempView("iris")  val df: DataFrame = spark.sql("select * from iris")  println("鳶尾花原始數(shù)據(jù)如下:")  df.map(t => t(1)+":"+t(0)).collect().foreach(println)  //    處理特征和標(biāo)簽,以及數(shù)據(jù)分組  val labelIndexer: StringIndexerModel = new StringIndexer().setInputCol("label").setOutputCol(  "indexedLabel").fit(df)  val featureIndexer: VectorIndexerModel = new VectorIndexer().setInputCol("features")  .setOutputCol("indexedFeatures").setMaxCategories(4).fit(df)  //這里我們?cè)O(shè)置一個(gè)labelConverter,目的是把預(yù)測(cè)的類別重新轉(zhuǎn)化成字符型的  val labelConverter: IndexToString = new IndexToString().setInputCol("prediction")  .setOutputCol("predictedLabel").setLabels(labelIndexer.labels)  //接下來(lái),我們把數(shù)據(jù)集隨機(jī)分成訓(xùn)練集和測(cè)試集,其中訓(xùn)練集占70%。  val Array(trainingData, testData) = data.randomSplit(Array(0.7, 0.3))  val dtClassifier: DecisionTreeClassifier = new DecisionTreeClassifier()  .setLabelCol("indexedLabel").setFeaturesCol("indexedFeatures")  //在pipeline中進(jìn)行設(shè)置  val pipelinedClassifier: Pipeline = new Pipeline()  .setStages(Array(labelIndexer, featureIndexer, dtClassifier, labelConverter))  //訓(xùn)練決策樹模型  val modelClassifier: PipelineModel = pipelinedClassifier.fit(trainingData)  //進(jìn)行預(yù)測(cè)  val predictionsClassifier: DataFrame = modelClassifier.transform(testData)  predictionsClassifier.select("predictedLabel", "label", "features").show(5)  //    評(píng)估決策樹分類模型  val evaluatorClassifier: MulticlassClassificationEvaluator = new MulticlassClassificationEvaluator()  .setLabelCol("indexedLabel")  .setPredictionCol("prediction").setMetricName("accuracy")  val accuracy: Double = evaluatorClassifier.evaluate(predictionsClassifier)  println("Test Error = " + (1.0 - accuracy))  val treeModelClassifier: DecisionTreeClassificationModel = modelClassifier.stages(2)  .asInstanceOf[DecisionTreeClassificationModel]  println("Learned classification tree model:\n" + treeModelClassifier.toDebugString)  spark.stop()  }  }

![[Pasted image 20230807184336.png]]

http://www.risenshineclean.com/news/60426.html

相關(guān)文章:

  • 個(gè)人網(wǎng)站建設(shè)的目標(biāo)百度網(wǎng)站制作聯(lián)系方式
  • 學(xué)做網(wǎng)站論壇vip碼百度競(jìng)價(jià)廣告點(diǎn)擊器
  • 松江營(yíng)銷型網(wǎng)站建設(shè)百度不收錄網(wǎng)站
  • 宛城區(qū)建網(wǎng)站本周熱點(diǎn)新聞事件
  • 寧都網(wǎng)站建設(shè)超級(jí)外鏈工具
  • 中國(guó)seo第一人網(wǎng)站優(yōu)化包括
  • 網(wǎng)約車后臺(tái)平臺(tái)網(wǎng)站建設(shè)昆明關(guān)鍵詞優(yōu)化
  • 企業(yè)產(chǎn)品展示型網(wǎng)站案例google下載官網(wǎng)
  • 有什么網(wǎng)站做生鮮配送的南寧seo規(guī)則
  • 如何做電商網(wǎng)站 昆明谷歌搜索網(wǎng)址
  • 哪里有給網(wǎng)站做360廣告投放是什么工作
  • 效果型網(wǎng)站建設(shè)網(wǎng)址域名大全2345網(wǎng)址
  • 服務(wù)器網(wǎng)站 都被做跳轉(zhuǎn)關(guān)鍵詞是什么意思
  • 網(wǎng)站建設(shè)的代碼關(guān)鍵字c語(yǔ)言
  • 網(wǎng)站上傳頁(yè)面seo查詢友情鏈接
  • 泰州做網(wǎng)站的推廣文案怎么寫
  • 鄭州龍華小學(xué)網(wǎng)站建設(shè)今天最新的新聞?lì)^條新聞
  • 免費(fèi)做網(wǎng)站bz3399西安百度公司
  • 進(jìn)口外貿(mào)流程寧波seo營(yíng)銷
  • 企業(yè)手機(jī)網(wǎng)站建百度競(jìng)價(jià)
  • 用vs做網(wǎng)站在安裝時(shí)要勾選建立一個(gè)網(wǎng)站需要多少錢
  • 網(wǎng)站建立快捷方式企業(yè)整站推廣
  • 高培淇自己做的網(wǎng)站seo優(yōu)化一般包括哪些內(nèi)容
  • 網(wǎng)站建設(shè)與運(yùn)營(yíng)策劃書站長(zhǎng)工具seo綜合
  • wordpress綁定槐蔭區(qū)網(wǎng)絡(luò)營(yíng)銷seo
  • 電影網(wǎng)站網(wǎng)頁(yè)設(shè)計(jì)上海好的網(wǎng)絡(luò)推廣公司
  • 保定網(wǎng)站設(shè)計(jì)概述百度關(guān)鍵詞優(yōu)化公司哪家好
  • wordpress add option臨沂網(wǎng)站seo
  • 網(wǎng)站制作費(fèi)可以做業(yè)務(wù)宣傳費(fèi)教程seo推廣排名網(wǎng)站
  • 網(wǎng)站后臺(tái)管理系統(tǒng)需求長(zhǎng)沙網(wǎng)站快速排名提升