中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當(dāng)前位置: 首頁 > news >正文

網(wǎng)站搭建與網(wǎng)站建設(shè)論文收錄網(wǎng)站排名

網(wǎng)站搭建與網(wǎng)站建設(shè),論文收錄網(wǎng)站排名,形容網(wǎng)站做的好的詞語,網(wǎng)站seo優(yōu)化費(fèi)用【GNN/深度學(xué)習(xí)】常用的圖數(shù)據(jù)集(圖結(jié)構(gòu)) 文章目錄【GNN/深度學(xué)習(xí)】常用的圖數(shù)據(jù)集(圖結(jié)構(gòu))1. 介紹2. 圖數(shù)據(jù)集2.1 Cora2.2 Citeseer2.3 Pubmed2.4 DBLP2.5 ACM2.6 AMAP & AMAC2.7 WIKI2.8 COCS2.9 BAT2.10 EAT2.11 UAT2.12 C…

【GNN/深度學(xué)習(xí)】常用的圖數(shù)據(jù)集(圖結(jié)構(gòu))

文章目錄

  • 【GNN/深度學(xué)習(xí)】常用的圖數(shù)據(jù)集(圖結(jié)構(gòu))
    • 1. 介紹
    • 2. 圖數(shù)據(jù)集
      • 2.1 Cora
      • 2.2 Citeseer
      • 2.3 Pubmed
      • 2.4 DBLP
      • 2.5 ACM
      • 2.6 AMAP & AMAC
      • 2.7 WIKI
      • 2.8 COCS
      • 2.9 BAT
      • 2.10 EAT
      • 2.11 UAT
      • 2.12 Corafull
    • 3. 如何讀取文件
    • 4. 下載鏈接
    • 5. 參考

1. 介紹

近年來,深度學(xué)習(xí)越來越關(guān)注圖方向的任務(wù),通過利用圖神經(jīng)網(wǎng)絡(luò)去挖掘現(xiàn)實(shí)中各種可以利用圖來表示事物(社交網(wǎng)絡(luò),論文引用網(wǎng)絡(luò),分子結(jié)構(gòu))等等,來學(xué)習(xí)更好的表示,去實(shí)現(xiàn)下游任務(wù)。

  • 圖數(shù)據(jù)是由一些點(diǎn)和一些線構(gòu)成的,能表示一些實(shí)體之間的關(guān)系,圖中的點(diǎn)就是實(shí)體,線就是實(shí)體間的關(guān)系。如下圖,v就是頂點(diǎn),e是邊,u是整張圖。attrinbutes(feature)是信息的意思,每個(gè)點(diǎn)、每條邊、每個(gè)圖都是有信息的。
    在這里插入圖片描述

2. 圖數(shù)據(jù)集

下面我們就來介紹深度學(xué)習(xí)中常用的圖數(shù)據(jù)集:Cora、Citeseer(Cite)、Pubmed、DBLP、ACM、AMAP、AMAC、Corafull、WIKI、COCS、BAT、EAT、UAT。

在這里插入圖片描述

每個(gè)數(shù)據(jù)集都包括:

  • label(圖節(jié)點(diǎn)的真實(shí)標(biāo)簽)
  • feat(圖節(jié)點(diǎn)的自身屬性)
  • adj(圖結(jié)構(gòu)對應(yīng)的鄰接矩陣)
    在這里插入圖片描述

數(shù)據(jù)集的下載鏈接附在后文。

2.1 Cora

Cora數(shù)據(jù)集包括2708份科學(xué)出版物,分為7類。引文網(wǎng)絡(luò)由5429個(gè)鏈接組成。數(shù)據(jù)集中的每個(gè)出版物都由一個(gè)0/1值的詞向量描述,表示字典中對應(yīng)的詞是否存在。這本詞典由1433個(gè)獨(dú)特的單詞組成。

2.2 Citeseer

Citeseer數(shù)據(jù)集包含3312份科學(xué)出版物,分為六類。引文網(wǎng)絡(luò)由4732個(gè)鏈接組成。數(shù)據(jù)集中的每個(gè)出版物都由一個(gè)0/1值的詞向量描述,表示字典中對應(yīng)的詞是否存在。這部詞典由3703個(gè)獨(dú)特的單詞組成。

2.3 Pubmed

Pubmed數(shù)據(jù)集包括Pubmed數(shù)據(jù)庫中有關(guān)糖尿病的19717篇科學(xué)論文,分為三類。引文網(wǎng)絡(luò)由44338個(gè)鏈接組成。數(shù)據(jù)集中的每個(gè)出版物都由字典中的TF/IDF加權(quán)詞向量描述,該字典由500個(gè)唯一的單詞組成。

2.4 DBLP

DBLP數(shù)據(jù)集是來自dblp網(wǎng)站的作者網(wǎng)絡(luò)。如果是共同作者關(guān)系,則兩個(gè)作者之間有一條邊。作者將研究內(nèi)容分為四個(gè)方面:數(shù)據(jù)庫、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和信息檢索。我們根據(jù)每個(gè)作者提交的會議來標(biāo)記他們的研究領(lǐng)域。作者特征是由關(guān)鍵字表示的詞袋中的元素。

2.5 ACM

這是來自ACM數(shù)據(jù)集的論文網(wǎng)絡(luò)。如果兩篇論文是同一作者寫的,那么兩篇論文之間就有一條邊。論文特征是關(guān)鍵詞的詞袋。我們選取在KDD、SIGMOD、SIGCOMM、MobiCOMM上發(fā)表的論文,按研究領(lǐng)域分為數(shù)據(jù)庫、無線通信、數(shù)據(jù)挖掘三類。

2.6 AMAP & AMAC

A-Photo和A-Computers提取自Amazon共購圖,其中節(jié)點(diǎn)表示產(chǎn)品,邊表示兩種產(chǎn)品是否經(jīng)常共購,特征表示用bag-of-words編碼的產(chǎn)品評論,標(biāo)簽是預(yù)定義的產(chǎn)品類別。

2.7 WIKI

維基百科(WIKI)是由世界各地的志愿者創(chuàng)建和編輯的在線百科全書。該數(shù)據(jù)集是由整個(gè)英文維基百科頁面組成的單詞共現(xiàn)網(wǎng)絡(luò)。該數(shù)據(jù)包含2405個(gè)節(jié)點(diǎn),17981條邊和19個(gè)標(biāo)簽。

2.8 COCS

Coauthor-CS和Coauthor-Physics是基于微軟學(xué)術(shù)圖的兩個(gè)包含合著關(guān)系的學(xué)術(shù)網(wǎng)絡(luò)。圖中的節(jié)點(diǎn)表示作者,邊表示合著關(guān)系。在每個(gè)數(shù)據(jù)集中,作者根據(jù)研究領(lǐng)域分別被分為15類和5類,節(jié)點(diǎn)特征是論文關(guān)鍵詞的詞袋表示。

2.9 BAT

數(shù)據(jù)來自國家民航局(ANAC) 2016年1月至12月。它有131個(gè)節(jié)點(diǎn),1038條邊(直徑為5)。機(jī)場活動(dòng)是由相應(yīng)年份的降落和起飛總數(shù)來衡量的。

2.10 EAT

數(shù)據(jù)來自歐盟統(tǒng)計(jì)局(Eurostat) 2016年1月至11月。它有399個(gè)節(jié)點(diǎn),5995條邊(直徑為5)。機(jī)場活動(dòng)是由相應(yīng)時(shí)期的降落加起飛的總數(shù)來衡量的。

2.11 UAT

數(shù)據(jù)來自美國交通統(tǒng)計(jì)局2016年1月至10月。它有1190個(gè)節(jié)點(diǎn),13599條邊(直徑為8)。機(jī)場活動(dòng)是通過相應(yīng)時(shí)期通過機(jī)場(到達(dá)和離開)的總?cè)藬?shù)來衡量的。

2.12 Corafull

Corafull數(shù)據(jù)集包括19793個(gè)節(jié)點(diǎn)、每個(gè)節(jié)點(diǎn)含有8710維的表示;并含有63421條邊,包含70個(gè)類別。

3. 如何讀取文件

解壓之后,放在項(xiàng)目文件下的dataset下,之后便可以利用如下函數(shù)進(jìn)行讀入。

def load_graph_data(dataset_name, show_details=False):"""- Param dataset_name: the name of the datasetshow_details: if show the details of dataset- Return: the features, labels and adj"""load_path = "dataset/" + dataset_name + "/" + dataset_namefeat = np.load(load_path+"_feat.npy", allow_pickle=True)label = np.load(load_path+"_label.npy", allow_pickle=True)adj = np.load(load_path+"_adj.npy", allow_pickle=True)if show_details:print("dataset name:   ", dataset_name)print("feature shape:  ", feat.shape)print("label shape:    ", label.shape)print("adj shape:      ", adj.shape)print("undirected edge num:   ", int(np.nonzero(adj)[0].shape[0]/2))print("category num:          ", max(label)-min(label)+1)print("category distribution: ")for i in range(max(label)+1):print("label", i, end=":")print(len(label[np.where(label == i)]))featur_dim = feat.shape[1]return feat, label, adj

4. 下載鏈接

圖數(shù)據(jù)集下載鏈接

5. 參考

【1】https://github.com/yueliu1999/DCRN

http://www.risenshineclean.com/news/46376.html

相關(guān)文章:

  • 建設(shè)主管部門門戶網(wǎng)站鄭州網(wǎng)站排名優(yōu)化公司
  • 網(wǎng)站服務(wù)器一個(gè)多少錢知名品牌營銷策略
  • 內(nèi)涵吧網(wǎng)站西安百度推廣運(yùn)營
  • 中國企業(yè)500強(qiáng)排名一覽表seo技術(shù)平臺
  • 企業(yè)門戶網(wǎng)站制作一網(wǎng)信息一個(gè)簡單便捷的新聞網(wǎng)站
  • 上海 網(wǎng)站平臺開發(fā)互聯(lián)網(wǎng)營銷師考試題及答案
  • wordpress數(shù)據(jù)庫沒有填寫培訓(xùn)行業(yè)seo整站優(yōu)化
  • 長安網(wǎng)站建設(shè)軟件開發(fā)北京seo關(guān)鍵詞排名優(yōu)化
  • 網(wǎng)站充值平臺怎么做的推廣平臺下載
  • 網(wǎng)站建設(shè)智能優(yōu)化seo軟件推廣哪個(gè)好
  • 詳情頁通用模板北京百度seo
  • 東莞市建設(shè)安監(jiān)局網(wǎng)站互動(dòng)營銷案例100
  • h5用什么網(wǎng)站來做推廣怎么推
  • 泛解析對網(wǎng)站的影響廈門網(wǎng)站推廣優(yōu)化哪家好
  • 寧波易通寧波網(wǎng)站建設(shè)優(yōu)化落實(shí)新十條措施
  • 專門教做甜品的網(wǎng)站微信營銷軟件手機(jī)版
  • 建設(shè)網(wǎng)站如何贏利企業(yè)網(wǎng)站cms
  • 廣州 網(wǎng)站開發(fā) 公司電話百度seo優(yōu)化排名
  • dw企業(yè)網(wǎng)站設(shè)計(jì)品牌營銷包括哪些內(nèi)容
  • 網(wǎng)站加載效果怎么做的百度推廣代運(yùn)營
  • wordpress mysql重啟資源網(wǎng)站優(yōu)化排名軟件公司
  • 成華網(wǎng)站制作為什么中國禁止谷歌瀏覽器
  • 標(biāo)題優(yōu)化方法郴州seo快速排名
  • 今日濮陽重大新聞seo優(yōu)化服務(wù)是什么意思
  • asp.net做的網(wǎng)站要放到網(wǎng)上空間去_要放哪些文件上去網(wǎng)站建網(wǎng)站建設(shè)網(wǎng)站
  • 房山新農(nóng)村建設(shè)網(wǎng)站深圳百度seo公司
  • 免費(fèi)代理ip的網(wǎng)站百度搜索推廣操作簡要流程
  • 如何進(jìn)行網(wǎng)站運(yùn)營與規(guī)劃打開百度網(wǎng)頁
  • 國外做批發(fā)配件的 在哪個(gè)網(wǎng)站百度葷seo公司
  • 傳奇網(wǎng)站怎么制作教程查關(guān)鍵詞