wordpress pixvideoseo推廣外包報(bào)價(jià)表
在單細(xì)胞RNA測(cè)序過程中,有時(shí)兩個(gè)或多個(gè)細(xì)胞可能在制備過程中意外結(jié)合成一個(gè)單一的"假細(xì)胞",稱為雙峰細(xì)胞或雙倍體。這些雙峰細(xì)胞可能會(huì)扭曲數(shù)據(jù)分析和解釋,因此,需要使用一些方法對(duì)它們進(jìn)行識(shí)別和剔除。其中DoubletFinder是最常用的一個(gè)工具。
官方對(duì)DoubletFinder輸入的對(duì)象和參數(shù)介紹
-
seu:這是一個(gè)完全處理過的 Seurat 對(duì)象,即已經(jīng)完成了數(shù)據(jù)規(guī)范化(NormalizeData)、尋找變異基因(FindVariableGenes)、數(shù)據(jù)標(biāo)準(zhǔn)化(ScaleData)、主成分分析(RunPCA)和 t-SNE 分析(RunTSNE)。
-
PCs:指定用于分析的統(tǒng)計(jì)顯著的主成分?jǐn)?shù)量,例如 PCs = 1:10。
-
pN:定義生成的人工雙倍體數(shù)量,以合并的真實(shí)-人工數(shù)據(jù)比例表示。默認(rèn)設(shè)置為 25%,根據(jù) McGinnis, Murrow 和 Gartner 在 2019 年的 Cell Systems 文章,DoubletFinder 的表現(xiàn)在很大程度上與 pN 參數(shù)無關(guān)。
-
pK:定義用于計(jì)算 pANN 的 PC 鄰域大小,同樣以合并的真實(shí)-人工數(shù)據(jù)比例表示。沒有默認(rèn)值,因?yàn)槊總€(gè)單細(xì)胞 RNA 測(cè)序數(shù)據(jù)集都應(yīng)該調(diào)整 pK 值。最優(yōu)的 pK 值應(yīng)該使用下面描述的策略來估計(jì)。
-
nExp:定義用于做出最終雙倍體/單倍體預(yù)測(cè)的 pANN 閾值。這個(gè)值最好從 10X 或 Drop-Seq 設(shè)備的細(xì)胞加載密度中估計(jì),并根據(jù)同源雙倍體的預(yù)估比例進(jìn)行調(diào)整。
官網(wǎng)文檔中對(duì)示例數(shù)據(jù)的要求和參數(shù)進(jìn)行了解釋。其中seu對(duì)象是建議提前進(jìn)行處理的。PC值其實(shí)可以按照使用者降維聚類選擇的值而定。pN就默認(rèn)25%即可。pK和nExp有函數(shù)可以進(jìn)行計(jì)算。
下面的表格是DoubletRate參數(shù)選擇的參考文件(10X),在分析之前參照這個(gè)表格上邊的細(xì)胞數(shù)選擇DoubletRate值。
步驟流程
1、導(dǎo)入
scRNA是多樣本已經(jīng)合并完成并進(jìn)行過標(biāo)準(zhǔn)流程后的數(shù)據(jù)集
rm(list=ls())
library(DoubletFinder)
library(BiocParallel)
library(qs)
library(Seurat)register(MulticoreParam(workers?=?4,?progressbar?=?TRUE))
scRNA?<-?qread("./sce.qs")
table(scRNA$orig.ident)#?check一下
DimPlot(scRNA,pt.size?=?0.8,group.by?=?"orig.ident",label?=?F)
2、DoubletFinder分析
一般是建議按照每個(gè)cluster進(jìn)行分析,SCT參數(shù)是指SCTransform,如果是其他方式比如harmony之后的,可以考慮不選擇T。
#單個(gè)分開,用來做DoubletFinder
sce_list?<-?SplitObject(scRNA,?split.by?=?"orig.ident")pc.num?<-?1:30
DoubletRate?=?0.023?#?大約4800的細(xì)胞
#?找到pK
sweep.res?<-?paramSweep(sce_list[["C1"]],?PCs?=?pc.num,?sct?=?F)?#?sct也可以選擇T
sweep.stats?<-?summarizeSweep(sweep.res,?GT?=?FALSE)
bcmvn?<-?find.pK(sweep.stats)
pK_bcmvn?<-?bcmvn$pK[which.max(bcmvn$BCmetric)]?%>%?as.character()?%>%?as.numeric()#?計(jì)算homotypic?doublets的比例和預(yù)期的doublet數(shù)目
homotypic.prop?<-?modelHomotypic(sce_list[["C1"]]$seurat_clusters)???#?最好提供celltype
nExp_poi?<-?round(DoubletRate?*?ncol(sce_list[["C1"]]))
nExp_poi.adj?<-?round(nExp_poi?*?(1?-?homotypic.prop))#?使用確定的參數(shù)鑒定doublets
sce_list[["C1"]]?<-?doubletFinder(sce_list[["C1"]],?PCs?=?pc.num,?pN?=?0.25,?pK?=?pK_bcmvn,?nExp?=?nExp_poi.adj,?reuse.pANN?=?F,?sct?=?F)?#?也可以選擇T#?圖片展示
DimPlot(sce_list[["C1"]],?reduction?=?"umap",?group.by?=?"DF.classifications_0.25_0.28_95")
對(duì)sce_list中的每一個(gè)樣本都需要走一遍流程,之后再進(jìn)行合并。
流程不復(fù)雜,C1名稱需要按照自己數(shù)據(jù)修改,如果樣本量多的話步驟會(huì)比較繁瑣,使用者可考慮進(jìn)行函數(shù)封裝。
同時(shí)也有一些觀點(diǎn)認(rèn)為應(yīng)謹(jǐn)慎處理雙細(xì)胞,因?yàn)檫@些雙細(xì)胞畢竟是人為定義的,那么是不是真的是雙細(xì)胞其實(shí)也是要思考的,所以可以先進(jìn)行雙細(xì)胞的檢測(cè)不刪除,等后續(xù)觀察細(xì)胞分群的情況以及功能富集等一些操作之后再做考慮。
參考資料:
1、DoubletFinder: https://github.com/chris-mcginnis-ucsf/DoubletFinder
2、單細(xì)胞天地:https://mp.weixin.qq.com/s/O0U8vlMIG9vUVE3FK08LJg
致謝:感謝曾老師以及生信技能樹團(tuán)隊(duì)全體成員。
注:若對(duì)內(nèi)容有疑惑或者有發(fā)現(xiàn)明確錯(cuò)誤的朋友,請(qǐng)聯(lián)系后臺(tái)(歡迎交流)。更多內(nèi)容可關(guān)注公眾號(hào):生信方舟
- END -