玉林市網(wǎng)站開發(fā)公司swot分析
Minitab 的直方圖結(jié)果分析解釋
步驟 1:評(píng)估關(guān)鍵特征
檢查分布的尖峰和散布。評(píng)估樣本數(shù)量對(duì)直方圖外觀的影響。
標(biāo)識(shí)尖峰(即,條的最高聚類):
尖峰表示樣本中最常見的值。評(píng)估樣本的散布以了解數(shù)據(jù)的變異程度。例如,在客戶等待時(shí)間的此直方圖中,數(shù)據(jù)的尖峰出現(xiàn)在大約 6 分鐘處。數(shù)據(jù)大約散布在 2 分鐘到 12 分鐘之間。
觀察此直方圖上任何奇怪的或不需要的特征。例如,客戶等待時(shí)間的直方圖顯示的散布寬度超出預(yù)期。經(jīng)觀察發(fā)現(xiàn),是計(jì)算機(jī)軟件更新導(dǎo)致了客戶等待時(shí)間延遲。
樣本數(shù)量 (n):樣本數(shù)量可能會(huì)影響圖形的外觀。
例如,盡管這兩個(gè)直方圖似乎有相當(dāng)大的差異,但它們都是使用從同一個(gè)總體中隨機(jī)選擇的數(shù)據(jù)樣本創(chuàng)建的。
當(dāng)樣本數(shù)量最少為 20 時(shí),直方圖效果最佳。如果樣本數(shù)量太小,直方圖上每個(gè)條形包含的數(shù)據(jù)點(diǎn)不足,無法準(zhǔn)確顯示數(shù)據(jù)的分布情況。樣本越大,直方圖與總體分布的形狀越相似。如果樣本數(shù)量小于 20,請(qǐng)考慮改用單值圖。
步驟 2:查找非正?;虍惓?shù)據(jù)的指示符
偏斜數(shù)據(jù)和多模態(tài)數(shù)據(jù)表明數(shù)據(jù)可能不正常。異常值可能表明數(shù)據(jù)中存在其他情況。
偏斜數(shù)據(jù):當(dāng)數(shù)據(jù)偏斜時(shí),大多數(shù)數(shù)據(jù)位于圖形的高或低側(cè)。偏斜表明數(shù)據(jù)可能未呈正態(tài)分布。
這些直方圖說明的是偏斜數(shù)據(jù)。帶右偏斜數(shù)據(jù)的直方圖顯示等待時(shí)間。大部分等待時(shí)間相對(duì)較短,只有少數(shù)等待時(shí)間很長。帶左偏斜數(shù)據(jù)的直方圖顯示失效時(shí)間數(shù)據(jù)。少數(shù)幾個(gè)項(xiàng)立即失敗,更多的項(xiàng)會(huì)在隨后失敗。
如果已知數(shù)據(jù)本身未偏斜,請(qǐng)觀察可能的原因。如果希望分析嚴(yán)重偏斜的數(shù)據(jù),請(qǐng)分析“數(shù)據(jù)注意事項(xiàng)”主題,以確保可以使用非正常數(shù)據(jù)。
異常值:異常值是遠(yuǎn)離其他數(shù)據(jù)值的數(shù)據(jù)值,可能會(huì)顯著影響的結(jié)果。通常情況下,在箱線圖上最容易識(shí)別異常值
在直方圖上,兩端上的孤立條形標(biāo)識(shí)異常值。嘗試確定導(dǎo)致任何異常值的原因,更正任何數(shù)據(jù)輸入錯(cuò)誤或測(cè)量誤差。考慮刪除與異常的單次事件(也稱為特殊原因)相關(guān)聯(lián)的數(shù)據(jù)值。然后,重新執(zhí)行分析。
多模態(tài)數(shù)據(jù):多模態(tài)數(shù)據(jù)具有多個(gè)峰值。(峰值表示一組數(shù)據(jù)的模式。)如果數(shù)據(jù)是從多個(gè)過程中或在多個(gè)條件(如多個(gè)溫度)下收集的,通常會(huì)出現(xiàn)多模態(tài)數(shù)據(jù)。
例如,這些直方圖是包含相同數(shù)據(jù)的圖形。簡(jiǎn)單直方圖包含兩個(gè)尖峰,但它并未清楚地指示尖峰的含義。含組的直方圖表明,尖峰與兩個(gè)組相對(duì)應(yīng)。
如果具有其他可用來對(duì)觀測(cè)值進(jìn)行分組的信息,則可以創(chuàng)建一個(gè)包含此信息的組變量。然后,可以創(chuàng)建含組的圖形,以確定組變量是否導(dǎo)致數(shù)據(jù)中的峰值。
步驟 3:評(píng)估對(duì)分布的擬合
如果直方圖含擬合分布線,請(qǐng)?jiān)u估條形的高度對(duì)分布線形狀的服從緊密程度。如果下面的條形緊密地服從擬合分布線,則數(shù)據(jù)能夠很好地?cái)M合分布。
步驟 4:評(píng)估和比較組
如果直方圖含組,請(qǐng)?jiān)u估和比較組的中心和散布。
中心:查找組中心之間的差異。
例如,這些直方圖顯示三個(gè)版本的信用卡應(yīng)用程序的完成時(shí)間。每個(gè)版本的信用卡應(yīng)用程序的中心位于一個(gè)不同的位置。位置差異表明完成時(shí)間的均值存在差異。
要確定均值的差值在統(tǒng)計(jì)意義上是否顯著,可以進(jìn)行如下操作:
????如果只有兩個(gè)組,請(qǐng)使用雙樣本 t 檢驗(yàn)。
????如果有三個(gè)或多個(gè)組,請(qǐng)使用單因子方差分析。
散布:查找組散布之間的差異。
例如,這些直方圖顯示由三臺(tái)機(jī)器填充的罐子的重量。盡管這些直方圖的中心幾乎相同,但有些直方圖比較寬和分散。散布得越寬,這些機(jī)器對(duì)罐子的填充越不一致。
要確定散布(方差)之間的差異在統(tǒng)計(jì)意義上是否顯著,可以進(jìn)行如下操作:
如果只有兩個(gè)組,請(qǐng)使用雙方差檢驗(yàn)。
如果有三個(gè)或多個(gè)組,請(qǐng)使用等方差檢驗(yàn)。