怎么查詢網(wǎng)站有沒有做網(wǎng)站地圖武漢百度推廣多少錢
邊緣概率密度圖是一種在多變量數(shù)據(jù)分析中常用的圖形工具,用于顯示每個單獨變量的概率密度估計。它通常用于散點圖的邊緣,以便更好地理解單個變量的分布情況,同時保留了散點圖的相關(guān)性信息。
在邊緣概率密度圖中,每個變量的概率密度估計通常通過直方圖或核密度估計(KDE)進(jìn)行計算。直方圖將變量的值范圍分成若干個區(qū)間,并統(tǒng)計每個區(qū)間中觀察值的數(shù)量,然后將數(shù)量除以總觀察值數(shù)量得到概率密度。而核密度估計則是通過在每個數(shù)據(jù)點周圍放置核函數(shù),并根據(jù)核函數(shù)的形狀和寬度來估計概率密度。
邊緣概率密度圖通常與散點圖一起顯示,其中散點圖展示了兩個變量之間的關(guān)系,而邊緣概率密度圖則展示了每個變量的分布情況。這有助于發(fā)現(xiàn)變量之間的相關(guān)性以及每個變量的個體特征。如下圖所示:
?代碼如下:
library("ggExtra")
library("ggplot2")piris <- ggplot(iris, aes(Sepal.Length, Sepal.Width, colour = Species)) +geom_point()
ggMarginal(piris, groupColour = TRUE, groupFill = TRUE)
piris <- ggplot(iris, aes(Sepal.Length, Sepal.Width, colour = Species)) + geom_point()
:首先,創(chuàng)建了一個散點圖piris
,其中 x 軸表示 Sepal.Length(花萼長度),y 軸表示 Sepal.Width(花萼寬度),并根據(jù) Species(鳶尾花種類)變量進(jìn)行顏色編碼。
ggMarginal(piris, groupColour = TRUE, groupFill = TRUE)
:然后,使用ggMarginal()
函數(shù)對piris
圖進(jìn)行了包裝,以創(chuàng)建帶有邊際圖的散點圖。參數(shù)groupColour = TRUE
和groupFill = TRUE
用于在邊際圖中反映顏色組。這意味著對于每個不同的鳶尾花種類,都會生成一個單獨的邊際圖,以反映該組中的數(shù)據(jù)分布情況。
iris的數(shù)據(jù)集形式如下:
?