中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當(dāng)前位置: 首頁(yè) > news >正文

福田網(wǎng)站開(kāi)發(fā)北京seo營(yíng)銷(xiāo)培訓(xùn)

福田網(wǎng)站開(kāi)發(fā),北京seo營(yíng)銷(xiāo)培訓(xùn),網(wǎng)站開(kāi)發(fā)課程的心得,dw網(wǎng)站管理與建設(shè)大家在做數(shù)據(jù)分析或者機(jī)器學(xué)習(xí)應(yīng)用過(guò)程中,不可避免的需要對(duì)數(shù)據(jù)進(jìn)行降維操作,好多垂直行業(yè)業(yè)務(wù)中經(jīng)常出現(xiàn)數(shù)據(jù)量少但維度巨大的情況。數(shù)據(jù)降維的目的是為了剔除不相關(guān)或冗余特征,使得數(shù)據(jù)易用,去除無(wú)用數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)可…

? ? ? 大家在做數(shù)據(jù)分析或者機(jī)器學(xué)習(xí)應(yīng)用過(guò)程中,不可避免的需要對(duì)數(shù)據(jù)進(jìn)行降維操作,好多垂直行業(yè)業(yè)務(wù)中經(jīng)常出現(xiàn)數(shù)據(jù)量少但維度巨大的情況。數(shù)據(jù)降維的目的是為了剔除不相關(guān)或冗余特征,使得數(shù)據(jù)易用,去除無(wú)用數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)可視化,提高模型精確度,減少運(yùn)行成本,減少特征個(gè)數(shù)并關(guān)注本質(zhì)特征,確保數(shù)據(jù)特征屬性間相互獨(dú)立。

1.數(shù)據(jù)降維的主要方法

數(shù)據(jù)降維主要有線性和非線性方法,線性方法有PCA 、ICA、LDA、LFA、LPP(LE 的線性表示),非線性方法有基于核函數(shù)——KPCA 、KICA、KDA,基于特征值的流型學(xué)習(xí)——ISOMAP、LLE、LE、LPP、LTSA、MVU。
本文主要講述PCA和ICA以及NMF,NMF是一種只關(guān)注非負(fù)值的PCA降維方法。其中,PCA是一種全新的正交特征(也被稱(chēng)為主成分)來(lái)表示向數(shù)據(jù)變化最大的方向投影(最大方差),或者說(shuō)向重構(gòu)誤差最小化的方向投影,形成維度更少、正交的數(shù)據(jù)特征。

2.數(shù)據(jù)降維的應(yīng)用場(chǎng)景

主要應(yīng)用于文本處理、人臉識(shí)別、圖片識(shí)別、自然語(yǔ)言處理、業(yè)務(wù)環(huán)節(jié)的高維數(shù)據(jù)處理等領(lǐng)域。

3.數(shù)據(jù)降維示例

數(shù)據(jù)降維方法的主要示例詳見(jiàn)下方。

import numpy as np  
import matplotlib.pyplot as plt  
import cv2  #主成分分析PCA
mean = [20, 20]             # 各維度的均值,確定數(shù)據(jù)維度,表示1行2列,長(zhǎng)度為N的一維矩陣  
cov = [[5, 0], [25, 25]]    # 協(xié)方差矩陣,且協(xié)方差矩陣必須是對(duì)稱(chēng)矩陣和半正定矩陣(形狀為(N,N)的二維數(shù)組) 
np.random.seed(42) #設(shè)置隨機(jī)種子點(diǎn),這樣每次生成數(shù)據(jù)都一樣  
x, y = np.random.multivariate_normal(mean, cov, 2000).T #根據(jù)均值和協(xié)方差矩陣情況生成一個(gè)多元正態(tài)分布矩陣  
plt.figure(figsize=(10, 6))  
plt.plot(x, y, 'o', zorder=1)  
plt.axis([0, 40, 0, 40])  
plt.xlabel('source feature 1')  
plt.ylabel('source feature 2')  
plt.show()  
X = np.vstack((x, y)).T #組合成特征矩陣  
mu, eig = cv2.PCACompute(X, np.array([])) #以空數(shù)組作為蒙版,獲得平均值和協(xié)方差矩陣的特征向量eig  
plt.figure(figsize=(10, 6))  
plt.plot(x, y, 'o', zorder=1)  
plt.quiver(mean, mean, eig[:, 0], eig[:, 1], zorder=3, scale=0.2, units='xy')  
plt.text(mean[0] + 5 * eig[0, 0], mean[1] + 5 * eig[0, 1], 'v1', zorder=5,  
fontsize=16, bbox=dict(facecolor='white', alpha=0.6))  
plt.text(mean[0] + 7 * eig[1, 0], mean[1] + 4 * eig[1, 1], 'v2', zorder=5,  
fontsize=16, bbox=dict(facecolor='white', alpha=0.6))  
plt.axis([0, 40, 0, 40])  
plt.xlabel('feature 1')  
plt.ylabel('feature 2')  
plt.show()  #1.opencv提供與PCA密切相關(guān)的降維技術(shù)  
X2 = cv2.PCAProject(X, mu, eig)     #選擇數(shù)據(jù),將xy坐標(biāo)軸旋轉(zhuǎn)為以v1,v2為坐標(biāo)軸,v1、v2的選擇來(lái)自于mu和eig  
plt.figure(figsize=(10, 6))  
plt.plot(X2[:, 0], X2[:, 1], '^')  
plt.xlabel('first principal component')  
plt.ylabel('second principal component')  
plt.axis([-20, 20, -10, 10])  
plt.show()  #2.sklearn提供與PCA密切相關(guān)的降維技術(shù)ICA  
from sklearn import decomposition  
ica = decomposition.FastICA() #與PCA類(lèi)似,但分解后選擇盡量相互獨(dú)立的成分。  
X2 = ica.fit_transform(X)  
plt.figure(figsize=(10, 6))  
plt.plot(X2[:, 0], X2[:, 1], '^')  
plt.xlabel('first independent component')  
plt.ylabel('second independent component')  
plt.axis([-0.2, 0.2, -0.2, 0.2])  
plt.show()  #3.sklearn提供PCA密切相關(guān)的降維技術(shù),即非負(fù)矩陣分解,僅僅處理那些非負(fù)的數(shù)據(jù),特征矩陣中不能有負(fù)值  
from sklearn import decomposition  
nmf = decomposition.NMF()  
X2 = nmf.fit_transform(X)  
plt.figure(figsize=(10, 6))  
plt.plot(X2[:, 0], X2[:, 1], 'o')  
plt.xlabel('first non-negative component')  
plt.ylabel('second non-negative component')  
plt.axis([0, 1.5, -0.5, 1.5])  
plt.show()

http://www.risenshineclean.com/news/40637.html

相關(guān)文章:

  • 廣西住房建設(shè)廳網(wǎng)站廈門(mén)人才網(wǎng)官網(wǎng)招聘信息網(wǎng)
  • 深圳企業(yè)做網(wǎng)站百度賬號(hào)安全中心官網(wǎng)
  • 做學(xué)校網(wǎng)站導(dǎo)航條應(yīng)該有哪些知乎關(guān)鍵詞排名優(yōu)化工具
  • 東莞營(yíng)銷(xiāo)型網(wǎng)站建設(shè)費(fèi)用鄭志平愛(ài)站網(wǎng)創(chuàng)始人
  • 邢臺(tái)做企業(yè)網(wǎng)站淘寶關(guān)鍵詞搜索量查詢(xún)工具
  • 網(wǎng)站建設(shè)公司yu專(zhuān)業(yè)百度seo排名優(yōu)化
  • 相關(guān)網(wǎng)站怎么做seo關(guān)鍵詞排名價(jià)格
  • 深圳設(shè)計(jì)網(wǎng)站培訓(xùn)學(xué)校開(kāi)發(fā)一個(gè)網(wǎng)站的步驟流程
  • 重慶網(wǎng)站建設(shè) 公司列舉常見(jiàn)的網(wǎng)絡(luò)營(yíng)銷(xiāo)工具
  • 團(tuán)購(gòu)網(wǎng)站推廣怎么做百度搜索關(guān)鍵詞技巧
  • 合肥有多少做網(wǎng)站的優(yōu)化營(yíng)商環(huán)境工作總結(jié)
  • 網(wǎng)站訪問(wèn)者qq山東工藝美術(shù)學(xué)院網(wǎng)站建設(shè)公司
  • 沃爾瑪網(wǎng)上商城可以用購(gòu)物卡嗎seo技術(shù)優(yōu)化整站
  • 設(shè)計(jì)師網(wǎng)站建設(shè)icp備案查詢(xún)官網(wǎng)
  • 溫州高端網(wǎng)站建設(shè)公司哪家好全球最大的磁力搜索引擎
  • 一個(gè)公司做100個(gè)網(wǎng)站人民日?qǐng)?bào)官網(wǎng)
  • html5手機(jī)網(wǎng)站源碼月入百萬(wàn)的游戲代理
  • eclipse 簡(jiǎn)單網(wǎng)站開(kāi)發(fā)搜索關(guān)鍵詞的方法
  • 無(wú)錫哪里做網(wǎng)站市場(chǎng)調(diào)研報(bào)告怎么寫(xiě)
  • 企業(yè)網(wǎng)站建設(shè)西安今日熱點(diǎn)新聞事件摘抄50字
  • dedecms 網(wǎng)站地圖模板網(wǎng)絡(luò)熱詞作文
  • 用ul做的網(wǎng)站為何浮動(dòng)不上去seo關(guān)鍵詞優(yōu)化費(fèi)用
  • 東莞網(wǎng)站建設(shè)網(wǎng)站建設(shè)北京百度seo關(guān)鍵詞優(yōu)化
  • 宿遷網(wǎng)站推廣網(wǎng)站排名顧問(wèn)
  • 網(wǎng)站建設(shè)制作 武漢北京網(wǎng)站seo公司
  • 廣州南站在哪個(gè)區(qū)電商最好賣(mài)的十大產(chǎn)品
  • 昆明網(wǎng)站建設(shè)-中國(guó)互聯(lián)百度app安裝下載免費(fèi)
  • 個(gè)人網(wǎng)站需要建站群?jiǎn)岬谌酵茝V平臺(tái)
  • 建設(shè)網(wǎng)站的價(jià)格百度熱線電話
  • 淘寶客怎樣做自己的網(wǎng)站推廣網(wǎng)絡(luò)推廣培訓(xùn)班