網(wǎng)易企業(yè)郵箱怎么發(fā)送文件seo網(wǎng)絡營銷技巧
特征
插件 Reshape.XL 包括 130 個基本可組合功能。使用它們,您可以快速輕松地進行非常復雜的數(shù)據(jù)轉換和處理。它們的架構和基本定義受到 SQL 和 R 語言的強烈啟發(fā)。
到目前為止,類似的功能只能通過腳本語言供程序員使用。借助 Reshape.XL 插件,您還可以在簡單易用的可視化界面中訪問這些功能。插件函數(shù)分為七個基本組。這些邏輯組形成單獨的功能區(qū)選項卡。
#重塑
功能區(qū)選項卡“重塑”包含用于編輯數(shù)據(jù)集一般特征的基本功能。例如,分組-取消分組功能用于創(chuàng)建“虛擬子表”。以下功能在這些子表中單獨執(zhí)行。收集和傳播函數(shù)用作“行到列”和“列到行”轉換。使用 Transpose 和 Flip,您可以旋轉數(shù)據(jù)集。打包功能允許您自動刪除完全空的行和列。
#變量
功能區(qū)選項卡變量包含“基于列”的函數(shù)。例如,您可以格式化變量(數(shù)據(jù)類型)、選擇它們、重新排序、排列或重命名。Complete 函數(shù)用于補全數(shù)據(jù)集中缺失的組合(從隱式缺失值到顯式缺失值)。接下來,您可以組合或劃分變量。最后,所描述的選項卡包括用于處理缺失值的功能。
#子集
子集組中的函數(shù)用于從數(shù)據(jù)集中選擇行(記錄) - “基于行”函數(shù)。您可以通過多種方式過濾這些記錄 - 您可以選擇唯一記錄,可以對數(shù)據(jù)集進行隨機采樣,可以選擇前 N 個數(shù)據(jù)集記錄或后 N 個數(shù)據(jù)集記錄,最后,您可以使用復雜的 Slice 函數(shù)選擇數(shù)據(jù)集記錄。
#變異
變異函數(shù)用于修改現(xiàn)有變量或創(chuàng)建新變量。您可以逐步或一次編輯/改變多個變量。在這里您還可以找到“條件編輯”功能,這些功能可以根據(jù)定義的選擇標準修改變量。此外,您還會發(fā)現(xiàn) SQL 語言中眾所周知的許多其他功能,例如 Lead、Lag 或 Coalesce 命令或累積(例如 Cumulative Mean)和排名(例如 Row Number 或 Rank)函數(shù)。
#總結
另一組則專注于總結。這些函數(shù)計算選定的統(tǒng)計值,例如最小值、總和、平均值、中值、百分位數(shù)或四分位數(shù)范圍。這些函數(shù)可以應用于整個數(shù)據(jù)集(所有記錄)或數(shù)據(jù)集組。
#結合
以下一組功能可用于數(shù)據(jù)集組合。Join 函數(shù)的靈感來自于 SQL 語言中的類似函數(shù),通過不同的設置,您可以實現(xiàn)不同類型的連接,例如全連接、左連接、反連接或外連接。此外,您還可以使用其他組合數(shù)據(jù)集的函數(shù),例如 Intersect、Except、Set_Diff 或 Union。使用 Bind_Cols 函數(shù),可以將列從一個數(shù)據(jù)集插入到另一個數(shù)據(jù)集。
#特別的
最后一組包含一組特定功能。它們按指定的數(shù)據(jù)類型劃分。這些函數(shù)可用于處理數(shù)字、字符串和日期時間格式的變量。例如,您可以在統(tǒng)計分析之前對類別進行匿名化、從特定格式解析時間和日期值,或者使用多個與字符串相關的高級函數(shù)。
可以選擇組合各個插件功能。通過這種方式,您可以設計和執(zhí)行非常高級的數(shù)據(jù)轉換和調整類型。另一方面,他們的定義極其快速、簡單且高效。