愛站網(wǎng)seo工具查詢電商平臺(tái)
寫在前面
昨天在繪制Circos圈圖,已經(jīng)隔了2年左右沒有做這類的圖了。這時(shí)間過得真是快,但是文章和成果依舊是沒有很明顯的成效。只能安慰自己,后面的時(shí)間繼續(xù)加油吧!關(guān)于Cirocs圖的制作,我從剛開始到現(xiàn)在都是是使用TBtools進(jìn)行制作的,說實(shí)話,對于不想寫代碼的我(或是你)來說,生信可視化工具真的很方便。目前,生信可視化的工具很多,自己也加著2-3個(gè)類似的群,但最后一直使用到現(xiàn)在,以至于后面一直會(huì)使用的,TBtools是其中一個(gè)。我們在前面,也發(fā)表全程使用TBtools做分析教程,共線性分析 | Advance Circos圖繪制、基于TBtools做基因家族分析。從使用者的角度來說,TBtools真心是一個(gè)不錯(cuò)的軟件,基于開發(fā)者和用戶的反饋和需求開發(fā)很多小軟件。
關(guān)于今天的教程
我一直在說,我是一直在分享自己的學(xué)習(xí)筆記,所以內(nèi)容等方面都是基于自己目前在學(xué)習(xí)內(nèi)容,或是遇到的問題及解決方法。一方面是在記錄自己的學(xué)習(xí)筆記,一方面是為了后續(xù)自己用到便于查找(我基本使用到需要的),最后是為了分享給需要的同學(xué)。但是,自己的能力有限,很多高深的內(nèi)容自己涉及不到,或是沒能力涉及。因此,也歡迎各老師或同學(xué)來投稿或分享你的學(xué)習(xí)筆記。
一個(gè)人的力量是有限的,但是一群人的力量是無法預(yù)測的!!
Cirocs教程分享
需要的文件
- 基因組長度文件
Chr1 56706830
Chr2 51972579
Chr3 58931556
Chr4 64763011
Chr5 44819618
Chr6 42866092
Chr7 56236587
Chr8 49719271
- 所需繪制文件的位置信息文件
Chr2 35739245 35739448 1 .
Chr2 36071610 36072481 1 -
Chr2 36199462 36199872 1 .
Chr2 36274372 36276705 1 -
Chr2 36443766 36444019 1 .
Chr2 39128193 39128397 1 .
Chr2 39485207 39485428 1 .
Chr2 41001395 41003552 1 +
基因組長度文件
- 打開TBtools中
Fasta stats
- 拖入基因文件和輸出信息
所繪制的基因的文件
- 方法1:直接提取,可以使用教程共線性分析 | Advance Circos圖繪制的方法。
獲得基因位置信息文件
刪除不必要的信息
提取目標(biāo)基因的信息
拖拽文件文件時(shí),Selected Coluumn選擇我們要match的列
- 自己制作,所需的信息也就是的那么個(gè),我們可以通過自己的注釋文件進(jìn)行提取就可以,使用
awk
命令就醫(yī)做簡單的提取,我們這里就不在贅述。
我這里做個(gè)簡單的記錄,自己是補(bǔ)充前面做的分析的圖,因此,自己手中并沒有特定的繪圖問題,只有一個(gè)總文件和所需繪圖的基因ID,因此,只能用基因ID進(jìn)行提取信息。
## 導(dǎo)入總文件
df <- read.table("all_lncRNA.bed.txt",header = T)
head(df)
##----
ID Chromosome Start End type Strand
MSTRG.247.1 Chr1 152110 154340 1 +
MSTRG.364.2 Chr1 1230854 1231704 1 +
MSTRG.410.1 Chr1 1536449 1536977 1 +
MSTRG.545.1 Chr1 2665821 2668057 1 +
MSTRG.545.2 Chr1 2665899 2667587 1 +
MSTRG.545.3 Chr1 2665902 2668057 1 +
(1)入所需基因ID文件,由于各列的長度不同,因此不能正常使用read.table或read.csv函數(shù)導(dǎo)入
df <- readLines("typeID.txt")
# 將每行數(shù)據(jù)按照空格或制表符進(jìn)行拆分,得到一個(gè)列表
df.list <- strsplit(df,"\\s+")# 計(jì)算最大列數(shù),用于確定數(shù)據(jù)框的列數(shù)
max_cols <- max(sapply(df.list, length))
# 將數(shù)據(jù)補(bǔ)齊到相同的列數(shù),用NA填充缺失值
df_matrix <- t(sapply(df.list, function(x) {c(x, rep(NA, max_cols - length(x)))}))
# 將數(shù)據(jù)補(bǔ)齊到相同的列數(shù),用NA填充缺失值
data <- as.data.frame(df_matrix)
head(data)
colnames(data) <- c("C", "D", "H", "Ma", "O", "P", "S")
data <- data[-1,] ## 刪除首行
head(data)
正常運(yùn)行,應(yīng)該有更簡單的導(dǎo)入方法,歡迎交流。
(2)使用merge()函數(shù),或是其他函數(shù)進(jìn)行提取,其實(shí)merge在這里有點(diǎn)不太合適。
c <- as.data.frame(data$C)
c02 <- cold[!apply(is.na(c), 1, any),]c03 <- as.data.frame(c02)
colnames(c03) <- c("ID")
head(c03)df02 <- merge(df, c03, by = "ID")
head(df02)
write.table(df02, "C.bed.txt", sep = '\t',quote = FALSE, row.names = F, col.name = F)
此步僅記錄自己本次做的過程,可忽略,亦可交流。
繪圖
打開Advanced Circos
輸入所需文件
這里,我就只需要輸入基因長度文件信息
即可
獲得基因圈圖
添加其他文件信息,點(diǎn)擊Show Control Dialog
左邊是調(diào)整基因圈圖的參數(shù),右邊是添加其他信息和調(diào)整參數(shù)
提供了很多圖形的選項(xiàng),根據(jù)自己的需求進(jìn)行調(diào)整即可,以及顏色的調(diào)整。
最后就是細(xì)節(jié)調(diào)整,這些主要依賴于個(gè)人的審美和搭配。
---
**往期文章:****1. 最全WGCNA教程(替換數(shù)據(jù)即可出全部結(jié)果與圖形)**- [WGCNA分析 | 全流程分析代碼 | 代碼一](https://mp.weixin.qq.com/s/M0LAlE-61f2ZfpMiWN-iQg)- [WGCNA分析 | 全流程分析代碼 | 代碼二](https://mp.weixin.qq.com/s/Ln9TP74nzWhtvt7obaMp1A)- [WGCNA分析 | 全流程代碼分享 | 代碼三](https://mp.weixin.qq.com/s/rU76rLG4AayuiHbDhgOGBg)----**2. 精美圖形繪制教程**- [精美圖形繪制教程](https://mp.weixin.qq.com/mp/appmsgalbum?__biz=MzAwODY5NDU0MA==&action=getalbum&album_id=2614156000866385923&scene=173&from_msgid=2455848496&from_itemidx=1&count=3&nolastread=1#wechat_redirect)**3. 轉(zhuǎn)錄組分析教程**
小杜的生信筆記,主要發(fā)表或收錄生物信息學(xué)的教程,以及基于R的分析和可視化(包括數(shù)據(jù)分析,圖形繪制等);分享感興趣的文獻(xiàn)和學(xué)習(xí)資料!!