中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當(dāng)前位置: 首頁 > news >正文

做微商推廣有哪些好的分類信息網(wǎng)站seo關(guān)鍵詞優(yōu)化推廣外包

做微商推廣有哪些好的分類信息網(wǎng)站,seo關(guān)鍵詞優(yōu)化推廣外包,政府網(wǎng)站建設(shè)提供商名單,蘇州朗冠網(wǎng)站建設(shè)公司需求背景: XX一直使用約會(huì)網(wǎng)站尋找適合自己的約會(huì)對象,ta會(huì)把人分為3種類型: 不喜歡、魅力一般、非常有魅力 對人分類軸,發(fā)現(xiàn)了對象樣本的以下3種特征: 1、每年獲得的飛行里程數(shù) 2、玩視頻游戲所耗時(shí)間百分比 3、…

需求背景:

XX一直使用約會(huì)網(wǎng)站尋找適合自己的約會(huì)對象,ta會(huì)把人分為3種類型:

不喜歡、魅力一般、非常有魅力

對人分類軸,發(fā)現(xiàn)了對象樣本的以下3種特征:

1、每年獲得的飛行里程數(shù)

2、玩視頻游戲所耗時(shí)間百分比

3、每周消費(fèi)的冰淇淋數(shù)量

數(shù)據(jù)初始化:

將上述特征輸入到分類器之前,必須將待處理數(shù)據(jù)的格式處理成分類器可以接受的格式。因?yàn)樵磾?shù)據(jù)存在txt文件中,所以要?jiǎng)?chuàng)建一個(gè)函數(shù)處理數(shù)據(jù):

def file2matrix(filename):fr=open(filename)arrayOlines=fr.readlines()numberOfLines=len(arrayOlines)returnMat=zeros((numberOfLines,3))classLabelVector=[]index=0for line in arrayOlines:line=line.strip()listFromLine=line.split('\t')returnMat[index,:]=listFromLine[0:3]classLabelVector.append(int(listFromLine[-1]))index += 1return returnMat,classLabelVector

從上面的代碼可以看到,Python處理文本文件非常容易。

處理順序:

1、獲得文件的行數(shù)

2、創(chuàng)建以0填充的矩陣NumPy

3、循環(huán)處理文件中的每行數(shù)據(jù),使用函數(shù)line.strip()截取掉所有的回車字符

分析數(shù)據(jù):

使用Matplotlib制作原始數(shù)據(jù)的散點(diǎn)圖:

datingDataMat,datingLabels=file2matrix('datingTestSet2.txt')
fig=plt.figure()
ax=fig.add_subplot(111)
ax.scatter(datingDataMat[:,1],datingDataMat[:,2],15.0*array(datingLabels),15.0*array(datingLabels))
plt.show()

可以看到,由于沒有使用樣本分類的特征值,很難從圖中看出任何有用的數(shù)據(jù)模式信息,所以調(diào)試代碼,利用scatter函數(shù)進(jìn)行個(gè)性化標(biāo)記散點(diǎn)圖上的點(diǎn):

ax.scatter(datingDataMat[:,1],datingDataMat[:,2],15.0*array(datingLabels),15.0*array(datingLabels))

現(xiàn)在就可以看出每種分類人群的特征

準(zhǔn)備數(shù)據(jù):歸一化數(shù)值

從數(shù)據(jù)上可以看出,每年飛行里程數(shù)對于計(jì)算結(jié)果的影響遠(yuǎn)遠(yuǎn)大于另外兩個(gè)特征的影響。而產(chǎn)生這種線性的原因,僅僅是因?yàn)轱w行里程數(shù)遠(yuǎn)大于其他特征,但因?yàn)橛脩粽J(rèn)為這三種特征是同等重要的,所以作為特征之一,里程數(shù)不應(yīng)該如此嚴(yán)重的影響到計(jì)算結(jié)果。

處理這種不同取值范圍的特征值時(shí),我們通常采用的方法是將數(shù)值歸一化,比如將取值范圍處理為0到1或者-1到1之間。下面的公式可以將任意取值范圍轉(zhuǎn)化為0到1區(qū)間內(nèi)的值:

newValue=(oldValue-min)/(max-min)

其中min和max分別是數(shù)據(jù)集中的最小特征值和最大特征值。

歸一化函數(shù):

def autoNorm(dataSet):minVals=dataSet.min(0)maxVals=dataSet.max(0)ranges=maxVals-minValsnormDataSet=zeros(shape(dataSet))m=dataSet.shape[0]normDataSet=dataSet-tile(minVals,(m,1))normDataSet=normDataSet/tile(ranges,(m,1))return normDataSet,ranges,minVals

在這個(gè)函數(shù)中,我們將每列的最小值放在變量minVals中,將最大值放在變量maxVals中,其中dataSet.min(0)中的參數(shù)0使得函數(shù)可以從列中選取最小值,而不是選取當(dāng)前行的最小值。然后,函數(shù)計(jì)算可能的取值范圍,并創(chuàng)建新的返回矩陣。為了歸一化特征值,我們必須使用當(dāng)前值減去最小值,然后除以取值范圍。需要注意的是,特征矩陣由1000*3個(gè)值,而minVals和range的值都是1*3.為了解決這個(gè)問題,使用NumPy庫中的tile()函數(shù)將變量內(nèi)容復(fù)制乘輸入矩陣同樣大小的矩陣。這是具體特征值相處。

測試算法:作為完整程序驗(yàn)證分類器

機(jī)器學(xué)習(xí)算法一個(gè)很重要的工作就是評估算法的正確率,通常我們只提供90%的數(shù)據(jù)作為訓(xùn)練樣本,而使用剩余的10%作為測試數(shù)據(jù)。其中10%的測試數(shù)據(jù)應(yīng)該是隨機(jī)選擇的。

完美分類器的錯(cuò)誤量為0,而錯(cuò)誤率為1.0的分類器不會(huì)給出任何正確的分類

為了測試分類器效果,我們創(chuàng)建以下函數(shù):

def datingClassTest():hoRatio=0.10datingDataMat=datingLabels=file2matrix('datingTestSet2.txt')normMat,ranges,minVals=autoNorm(datingDataMat)m=normMat.shape[0]errorCount=0.0numTestVecs=int(m*hoRatio)for i in range(numTestVecs):classifierResult=classify0(normMat[i,:],normMat[numTestVecs:m,],datingLabels[numTestVecs:m],3)print(classifierResult,datingLabels[i])if (classifierResult!=datingLabels[i]):errorCount+=1.0print(errorCount/float(numTestVecs))

函數(shù)datingClassTest首先使用了file2matrix和autoNorm函數(shù)從文件中讀取數(shù)據(jù)并將其轉(zhuǎn)化為歸一化特征值。接著計(jì)算測試向量的數(shù)量,這一步?jīng)Q定了normMat向量中哪些數(shù)據(jù)用于測試,那些數(shù)據(jù)用于訓(xùn)練;然后將這兩部分?jǐn)?shù)據(jù)輸入到原始kNN分類器函數(shù)classify0.最后,函數(shù)計(jì)算錯(cuò)誤率并輸出結(jié)果。

需要注意,此處我們使用原始分類器。

分類器處理數(shù)據(jù)集的錯(cuò)誤率為5%,這是一個(gè)還不錯(cuò)的結(jié)果。我們可以改變函數(shù)中hoRatio和變量k的值,檢測錯(cuò)誤率是否會(huì)隨著變量值的變換而增加,

使用算法:構(gòu)建完整可用系統(tǒng)

上面已經(jīng)在數(shù)據(jù)上對分類器進(jìn)行了測試,現(xiàn)在可以用這個(gè)分類器對人員進(jìn)行分類:

def classifyPerson():resultList=['完全不喜歡','一般魅力','很有魅力']percentTats=float(input('每年玩視頻游戲的時(shí)間比例?'))ffMiles=float(input('每年的飛行里程數(shù)?'))iceCream=float(input('每年吃冰激凌的數(shù)量?'))datingDataMat,datingLabels=file2matrix('datingTestSet2.txt')normMat,ranges,minVals=autoNorm(datingDataMat)inArr=array([ffMiles,percentTats,iceCream])classifierResult=classify0((inArr-minVals)/ranges,normMat,datingLabels,3)print('你對于這個(gè)人的感受:',resultList[classifierResult-1])

http://www.risenshineclean.com/news/4853.html

相關(guān)文章:

  • 免費(fèi)咨詢問題的網(wǎng)站好的搜索引擎推薦
  • 用wordpress開發(fā)網(wǎng)站錦繡大地seo官網(wǎng)
  • 服裝網(wǎng)站建設(shè)任務(wù)表網(wǎng)站權(quán)重一般有幾個(gè)等級
  • 外面網(wǎng)站怎么做怎么創(chuàng)建一個(gè)屬于自己的網(wǎng)站
  • 圣誕節(jié)網(wǎng)站怎么做百度反饋中心
  • 做網(wǎng)站的公司有怎么創(chuàng)建私人網(wǎng)站
  • 怎么做網(wǎng)站訊息it培訓(xùn)機(jī)構(gòu)培訓(xùn)費(fèi)用
  • 分析網(wǎng)站建設(shè)流程seo流量排行榜神器
  • 網(wǎng)絡(luò)營銷工具分析百度搜索關(guān)鍵詞排名優(yōu)化技術(shù)
  • 茂名專業(yè)網(wǎng)站制作公司seo的公司排名
  • 為什么凡科網(wǎng)做的網(wǎng)站無法搜索網(wǎng)站收錄入口申請查詢
  • 建立b2b企業(yè)網(wǎng)站百度網(wǎng)盤登陸入口
  • 建設(shè)高效的政府門戶網(wǎng)站深圳seo專家
  • 國內(nèi)移動(dòng)端網(wǎng)站做的最好的抖音seo排名優(yōu)化
  • 帝國cms怎么做音樂網(wǎng)站如何查看一個(gè)網(wǎng)站的訪問量
  • 做金融網(wǎng)站有哪些要求網(wǎng)上的推廣公司
  • 外匯網(wǎng)站怎么做優(yōu)外匯網(wǎng)站怎么樣推廣自己的公司
  • 買東西哪個(gè)平臺(tái)質(zhì)量好seo助手
  • 無錫網(wǎng)站建設(shè)推廣重慶公司seo
  • 自助建站系統(tǒng)凡科百度權(quán)重高的發(fā)帖網(wǎng)站
  • 個(gè)人可以做外貿(mào)網(wǎng)站嗎福清網(wǎng)絡(luò)營銷
  • 注冊網(wǎng)站需要注意什么全渠道營銷
  • 哪些網(wǎng)站可以找到做海報(bào)的素材網(wǎng)絡(luò)營銷與直播電商是干什么的
  • 做網(wǎng)站需要幾個(gè)服務(wù)器百度推廣競價(jià)開戶
  • 產(chǎn)品做優(yōu)化好還是超級網(wǎng)站好龍崗網(wǎng)站制作
  • 陵園網(wǎng)站建設(shè)價(jià)格做網(wǎng)站的軟件叫什么
  • wordpress網(wǎng)站描述插件seo按照搜索引擎的
  • 如何建團(tuán)購網(wǎng)站網(wǎng)絡(luò)營銷是做什么的
  • 織夢如何做電商網(wǎng)站山東網(wǎng)絡(luò)優(yōu)化公司排名
  • 開發(fā)公司大廳售后長春seo網(wǎng)站管理