Excel表中資料如何進行抽取、分組、計算

怎麼計算一列資料的和

如何用DataFocus對Excel表中資料進行處理?

對Excel表中資料的處理,除了之前介紹過的“處理重複資料”、“處理缺失資料”、“資料轉換”,還會涉及“資料抽取”、“資料分組”、“資料計算”等方面。今天,我們將繼續介紹,如何在DataFocus系統中處理Excel表的資料。

一、匯入Excel資料表

在用DataFocus系統處理資料之前,需要先將本地Excel資料表匯入到系統中。大致流程如下:

資料表管理模組的“匯入表”欄下選擇匯入本地檔案(或資源管理功能模組中點選“建立資源”按鈕)。

選定“EXCEL”檔案型別,並在選擇本地檔案後點擊“上傳“。

上傳成功後的 Excel表配置資訊介面,可以選擇匯入的列、重新命名錶名及列名、修改列型別等等,配置完成確認無誤後點擊“確定”完成上傳。

二、資料處理

2.1 資料抽取

資料抽取,將表中某些欄位的部分資訊抽取出來,組合成新的欄位的過程。包括將某一欄位的部分資訊截取出來;將某幾個欄位合併為一個新欄位;給資料來源表中沒有的欄位匹配新的欄位。

2.1.1列拆分與公式抽取

在資料來源表中 ,若多項資料顯示於同一單元格中,則需要採用分列的方法抽取新欄位。分類抽取的源資料,需要具有一定的發生規律,如使用同一種間隔符號間隔,或者字串位置相同。

若資料間使用同一種間隔符號間隔,可以在DataFocus系統中,直接使用“列拆分”功能,根據間隔符號進行資料的拆分。具體操作如下:

A、進入DataFocus的搜尋模組,選擇資料來源表,並採用雙擊或搜尋框輸入列名的方式,選擇出需要按照特定分隔符進行拆分的列。

B、點選右上角的操作下拉框,找到“資料轉換”。

C、在資料轉換設定介面,資料轉換型別選擇“列拆分”,並選擇拆分的屬性列、設定拆分列數、拆列分隔符,再點選下一步。

D、定義分列後的各列名稱,點選確定即分列完成。

Excel表中資料如何進行抽取、分組、計算

圖表2。 1 列拆分

若資料中所需抽取的字串位置相同,則可以使用公式進行字串的抽取。

在系統的搜尋模組,選擇資料來源表後,可以直接在搜尋框中使用公式,也可以在左下角的“增加公式”中製作公式列。

例如圖表2。 2,獲取“姓名”列中每個人的姓氏時,若所有人都是單姓,沒有複姓,可以直接使用公式“substr”獲取“姓名”列中第一個字串。

Excel表中資料如何進行抽取、分組、計算

圖表2。 2 字串抽取

2.1.2 合併得到新欄位

在日常工作中 ,有時需要將多列資訊合併到一列中。此時可以使用DataFocus系統中的“concat”公式來實現。

在系統的搜尋模組,選擇資料來源表並進入“增加公式”介面,進行公式concat的編輯並儲存為公式列。雙擊或在搜尋框輸入該公式的列名,即可完成對列資訊的合併與檢視。

公式的使用方式,可參考公式編輯介面的“公式輔助”。在滑鼠滑動到公式上方時,會看到該公式的使用樣例,如圖2。3。

concat公式是對字串的連線操作,若需將其它型別的欄位進行連線,可以使用轉換公式進行資料型別的轉換。

Excel表中資料如何進行抽取、分組、計算

圖表2。 3 concat公式

2.1.3 用公式返回值抽取新資料

我們需要的欄位有時候不能從資料來源表字段中直接提取,而是需要透過計算得到。這時,在DataFocus系統中,可以透過公式來實現。

如圖表2。4,一份員工的業績資料表,想要依據員工的業績計算出提成金額,併成為源表資料的一部分。計算規則:當業績小於3000時,提成率為5%;當業績在3000到8000之間時,提成率為8%;當業績在8000以上時,提成率為12%。

Excel表中資料如何進行抽取、分組、計算

圖表2。4 源資料

在DataFocus系統的搜尋模組,選擇資料來源表後,點選下方的“增加公式”,使用公式“if。。。then。。。else”進行計算並儲存為公式列。

Excel表中資料如何進行抽取、分組、計算

圖表2。5 製作公式列

對於需要儲存的資料列,雙擊或在搜尋框中輸入列名,並在搜尋欄下選擇“儲存為中間表”,即可將當前展示的資料以資料表形式儲存到系統中,並用於今後的資料分析。

Excel表中資料如何進行抽取、分組、計算

圖表2。6 以資料表形式保持到系統

2.2 資料分組與計算

在DataFocus系統中,可以直接使用分組關鍵詞對數值列進行分組統計。例如上面提到的員工業績資料表,根據業績分組並統計每組員工人數。

如圖2。7 ,在系統的搜尋模組,選擇資料來源表後,搜尋框中直接輸入“按業績分3組間隔為1000統計的”“姓名的數量”,即完成對“業績”列按間隔為1000分2組(剩餘部分自動歸為“其他”),並統計出各組員工人數。

Excel表中資料如何進行抽取、分組、計算

圖表2。7 分組統計

在DataFocus系統中 ,對於資料的計算,可以使用公式來實現。公式的使用方式同上,透過“增加公式”視窗製作公式列,或直接在搜尋框中進行公式的使用。

三、文末

DataFocus系統中的公式,包括聚合公式、分析公式、日期公式、混合函式、數字函式、邏輯運算子、文字操作函式等,所以對於Excel表中資料的抽取、分組、計算等處理,都可以使用公式來實現。