如何資料視覺化

天下雜誌資料記者 林佳賢

我做的事情

  • 資料分析
  • 資料新聞
  • 資料視覺化

運用的資料來源

  • 政府開放資料
  • 網路上爬取的資料
  • 民間機構私下提供的資料

今天就來講講我如何把資料視覺化

這是一張捷運路線圖

運用財政部財政資訊中心的所得稅資料,找出台北捷運站每座車站所在村里的所得中位數,再一一填到捷運路線圖上。

另一種分析角度

除了較直觀、有趣的呈現方式,所得稅資料還能進行更深入的分析。

 

在「捷運坐一站,收入就少20萬? 7張圖表帶你從捷運看台北貧富差距」的文章中,我用填色地圖,分析捷運站間的所得差距。

另一種分析角度

在「全台所得差距最大的9個地方落腳何處?9張圖表帶你看清楚」的文章中,我用簡單的數學計算,找出台灣所得差距最大的九個地方。

 

計算方式是找出每個村里周遭有哪些村里,在計算該村里的所得中位數,與周遭村里所得中位數的中位數差。

使用財政部所得稅資料的啟示

  • 只要使用得當,枯燥的資料也可以很有趣
  • 一份資料可以用很多種角度分析
  • 不同的角度可以得到不同的insight
  • 但要注意每種角度只是真實的某一面

薪資資料分析

十六種行業

在「曾經最高薪的不動產業,過了35年卻幾乎墊底?9張圖表帶你看台灣各行業的薪資變遷」中,我使用了主計總處的歷年各業受僱員工每人每月薪資資料,分析十六種行業的變化。

男女薪資差異

在「女生只有拉保險或當房屋仲介才賺得贏男生?4張圖表帶你看93個行業的男女薪資差距」中,我使用另一份薪資調查資料「行政院主計總處2014年受僱員工薪資調查統計表」,分析哪些職業的男女薪資差距較大,哪些薪資女/男性薪資較高。

使用薪資資料的啟示

  • 單純的折線圖也能呈現大趨勢
  • 相同的主題有不同的資料來源
  • 不同的資料來源能切不同的角度
  • 但要注意:每種分類的人數不同,分析結果也會受到影響

實價登錄資料應用

臺北哪裡房價最貴

在「一張「大富翁桌遊圖」帶你看台北市房價最高和最低的路段」中,我使用內政部104年第2-3季實價登錄資料,找出台北市哪些路段的房價最高。

找出房價漲最多的縣市

利用網頁互動功能,還能讓使用者自行操作,探索台灣23個縣市的房價變動。

實價登錄資料的使用心得

  • 幫助民眾從非房仲業者角度了解房市
  • 網頁互動功能使用者能自行探索資料
  • 無法處理的現實情況:房仲的小花招

如果開放資料無法下載

這個地圖使用的資料,並沒有打包好讓使用者下載,只有開放查詢功能。

 

如果需要使用整個房屋使用執照資料,就需要自行用爬蟲程式下載。

名為「開放」但實則「不開放」

  • 如何說服政府把原始資料打包開放
  • 爬蟲程式是否是「必要」的權宜之計
  • 爬蟲程式是否有成功爬到所有資料?

我的信箱

imandylin2@gmail.com

中興大學演講簡報

By Andy Lin

中興大學演講簡報

  • 743