網(wǎng)站怎么做預約小程序電商網(wǎng)站seo
一、挖掘頻繁模式、關(guān)聯(lián)和相關(guān)性
頻繁模式(frequent pettern)是在數(shù)據(jù)中頻繁出現(xiàn)的模式。
頻繁項集一般是指頻繁的在事務(wù)數(shù)據(jù)集中一起出現(xiàn)的商品的集合。
頻繁出現(xiàn)的子序列,如顧客傾向于先買相機,再買內(nèi)存卡這樣的模式就是一個(頻繁)序列模式。
子結(jié)構(gòu)可能涉及不同的機構(gòu)模式,如圖、數(shù)或格。如果一個子結(jié)構(gòu)頻繁出現(xiàn),則可稱為(頻繁)結(jié)構(gòu)模式。
挖掘頻繁模式可以發(fā)現(xiàn)數(shù)據(jù)中有趣的關(guān)聯(lián)和相關(guān)性。
關(guān)聯(lián)規(guī)則可分為單維關(guān)聯(lián)規(guī)則和多維關(guān)聯(lián)規(guī)則。
二、用于預測分析的分類與回歸
分類是找出描述和區(qū)分數(shù)據(jù)類或概念的模型,以便能夠使用模型預測類標號未知的對象的類標號。
分類和回歸是有監(jiān)督的學習方法。數(shù)據(jù)集分為訓練集和測試集。
分類是預測類別的標號。
回歸是建立連續(xù)值函數(shù)模型,即用來預測難以獲得的數(shù)據(jù)值或缺失的數(shù)據(jù)。
兩種方法可以成為數(shù)值預測和類標號預測。
三、聚類分析
聚類分析是一種無監(jiān)督的學習方法。
聚類的特點是最大化類簇間的距離、最小化類簇內(nèi)樣本的距離。
四、離群點分析
大部分數(shù)據(jù)挖掘方法都將離群點視為噪聲或異常而丟棄。
但在欺詐檢測等應用中,離群點的出現(xiàn)則很重要。
參考文獻:數(shù)據(jù)挖掘:概念與技術(shù)(原書第三版)