您現在的位置是:首頁 > 棋牌

資料統計與分析,我做了3個小時,同事僅需5分鐘,原來沒做這一步

  • 由 Excel從零到一 發表于 棋牌
  • 2023-02-06
簡介Hello,大家好,今天跟大家分享下我們如何對excel進行資料清洗,將表格中的資料轉變為便於我們統計分析的資料,讓資料統計更加的快捷,準確資料清洗說白了就是清洗掉無用的資料如表格中殘缺的資料,合併的單元格,無用的字元,分離文字與數值,統一

空格字元與數字符誰大

Hello,大家好,今天跟大家分享下我們如何對excel進行資料清洗,將表格中的資料轉變為便於我們統計分析的資料,讓資料統計更加的快捷,準確

資料清洗說白了就是清洗掉無用的資料如表格中殘缺的資料,合併的單元格,無用的字元,分離文字與數值,統一單元格格式等,而

excel中的資料清洗經常是對錶格進行的第一步操作

,因為我們不能保證我們拿到的每一張表格都是規範的

資料統計與分析,我做了3個小時,同事僅需5分鐘,原來沒做這一步

很多時候會遇到這樣的情況我們要花費大量的時間來清洗資料,而對資料的統計與分析的時間很少,這也就是我們常說的整理2小時,統計1分鐘,下面跟大家列舉了幾個我們工作中經常遇到資料清洗與整理的問題,可以快速提高的我們資料統計與分析的效率

一、清除表格中的空格

空格是我資料表中的一個毒瘤,在我們拿到原始表後一定要先將表格中的空格清洗掉,因為如果單元格中有空格的存在,就會造成這兩個資料我們看起來是一樣的,但是excel會認為這是兩個完全不一樣的資料,比如在這裡我們輸入一個1然後在後面輸入一個空格,然後在另一個單元格中輸入1,讓兩者相等可以看到,他的結果是false,就證明excel認為這兩個單元格的內容是不一樣的,如下圖

資料統計與分析,我做了3個小時,同事僅需5分鐘,原來沒做這一步

最常見的就是我們使用vlookup、sumif等函式的時候經常會遇到資料看起來一樣,但是就是查詢不到結果,遇到這樣的情況我們可以使用替換來將表格中的空格批次的替換為空值,首先我們按Ctrl+H調出替換視窗,然後在查詢值中輸入一個空格,在替換為什麼都不要輸入,然後直接點選全部替換即可,這樣的話就能將表格中的所有空格都替換為空值

資料統計與分析,我做了3個小時,同事僅需5分鐘,原來沒做這一步

二、刪除資料中不可見字元

不可見字元就是我們看不到的字元,在excel中常見的就是換行符,以及空格,當然了,不可見字元不僅僅包含這兩種,不可見字元都包括:空格字元(Unicode字符集值32和160)與非列印字元(Unicode字符集值0到31、127、129、141、143、144和157),這些不可見字元常見於我們從erp中匯出的資料報表,如果你確定表格中有想要查詢的資料,並且沒有空格的存在,但是還是查詢不到資料的話,就可以考慮下是不是有不可見字元的存在,清除不可見字元,我們需要使用clean函式,

Clean函式:清除單元格中的不可見字元引數text:想要清洗的單元格

在這裡需要注意的是,clean函式的引數只能選擇一個單元格,如果說我們選擇一個區域的話,就要先選擇一個與原資料相等的區域,然後按住Ctrl+shift+回車三鍵填充資料才能得到想要的結果

資料統計與分析,我做了3個小時,同事僅需5分鐘,原來沒做這一步

如果你覺得這種方法比較麻煩,我們還可以使用分列來刪除不可見字元,只不過使用這種方法,只能一列一列的進行資料的清洗,效率比較低下,好處的就是簡單容易操作,不用新增新的資料區域,首選我們選擇想要清洗的列,然後點選資料,選擇分列,直接點選完成

資料統計與分析,我做了3個小時,同事僅需5分鐘,原來沒做這一步

三、一個單元格中僅輸入一個型別的資料

日常工作中,我們我們經常會遇到,或者說自己曾經制作過這樣的的表格,就是將不同型別的資料輸入到一個單元格中,如下圖,文字與數值都輸入在一個單元格中,這樣的資料不利於我們對資料進行統計分析,我們還要提取資料,然後進行資料的統計分析,但是如果我們在一開始就能將表格設計為右邊的表格,在最後分析資料的時候就會變得非常的簡單

資料統計與分析,我做了3個小時,同事僅需5分鐘,原來沒做這一步

如果你在工作中真的拿到這樣的表格,也不要怕,解決的辦法很多,但是最簡單的就是使用快速填充來提取資料,他的使用方法也很簡單首先我們在資料旁邊輸入一個模板,然後按快捷鍵Ctrl+E即可完成資料的提取,比如在這裡我們在旁邊輸入200,然後按Ctrl+E就能快速的提取到水果的銷售重量,單價的提取也是這樣的

資料統計與分析,我做了3個小時,同事僅需5分鐘,原來沒做這一步

工作中的資料提取類問題,快速填充一般都能提取到正確的資料,如果說你真的遇到這樣的問題,第一個一定要想到他呀

四、刪除無效的資料

無效的資料種類很多,需要根據自己的實際資料進行資料的清洗,比如我們想以部門為類別統計部門人數,但是某個人的部門資料是空的,而這個就是一個無效的資料,我們就需要把它刪除,或者他的部門這個資料比較模糊不能準確的表達出是哪一個部門的,我們也需要將其刪除

有的時候我們不希望資料中存在重複值,這個時候就可以使用刪除重複值來快速的將重複的資料刪掉,首先選擇要刪除的資料區域,然後點選資料功能組,然後找到刪除重複值,在列中選擇以那一列為準判斷重複,在這裡我們選擇的是專案,然後點選確定即可刪除重複值

資料統計與分析,我做了3個小時,同事僅需5分鐘,原來沒做這一步

五、杜絕合併單元格

原始表杜絕使用任何合併單元格,雖然合併單元格能讓表格整體佈局看起來更加的整潔,但是當我們對資料進行統計分析的時候,往往會因為合併單元格的使用造成錯誤的統計結果

使用合併單元格我們通常是將相同的資料放在一個單元格中,如果說你工作中真的遇到這樣的情況我們可以使用定位條件,來取消合併的單元格並批次的填充資料,首先取消合併單元格,然後按Ctrl+G調出定位視窗,點選定位條件選擇空值點選確定,然後在編輯欄中輸入等於合併單元格區域的第一個單元格,按Ctrl+回車批次填充資料

資料統計與分析,我做了3個小時,同事僅需5分鐘,原來沒做這一步

以上五種型別就是我們工作中經常遇到的資料清洗的型別,當我們自己在製作標的時候一定要儘量的避免出現這幾種情況,因為規範的資料我們拿來就可以直接進行資料統計,省去了資料清洗這一步驟,當然瞭如果我們拿到的是別人製作的表格,就只能一步一步的進行資料的清洗了

Top