數據應用的素質培養(1) – 閱讀與理解

by Aidan Kao
0 comment 98 views

轉職至數據領域已經超過五年了,雖比不上數據領域的各方大神,也不見得算得上平均水平,不過在過往幾份工作經歷中,我都獲得主管的認同,或許也算得上有些許貢獻吧!

以目前為止回過頭來看,我的許多能力仍然缺乏更細節與穩固的培養,這對於我在數據領域發展的天花板產生了上限,至少我發現了一些瓶頸,是該重新審視我在數據領域的一些狀況了⋯⋯。


我對數據領域的終極目標

事實上我是到了前幾個月才去仔細思考我對於數據領域有什麼看法,以及我認為我對於自己在數據領域中能夠扮演什麼角色?在關於「工具」與「本質」之我見中提到的「本質」是我在思考此問題的一個關鍵,假設每件事情都有一個終極目標,那我能否找到,又或者說「定義」出自己在此領域中的終極目標呢?

很幸運的是我「定義」出了一個至少到目前能說服我自己的一個目標:

「數據應用」

說起來十分抽象,但又很實際的一個詞,其更加本質的說法應該是「解決問題」,但「數據應用」顯然更貼近並明確指出與數據領域有關的敘述。


審視自我於數據應用的狀況

前面提到我認知到自己在數據領域的能力仍然缺乏更細節與穩固的培養,那到底是哪些東西呢?

數據與科學領域發展極為快速,各種新的知識、工具與方法幾乎以肉眼可見的速度飛快出來,甚至有些令人驚嘆,就如ChatGPT,幾乎在推出後得到很大程度對於生成式AI的關注度。當然這也是令一大部分本領域的人感到擔憂,擔憂自身趕不上這領域前沿的發展速度。

但我今天顯然不會去討論這個問題,我更加關注的是:「我到底缺的是哪些?」

回到談論「本質」這件事,我又再一次以這個角度思考這個問題,這次答案似乎更快出現。很顯然的我缺乏的不是「工具」,例如什麼最新技術?哪些工具的應用?又或者說哪些方法?


回顧我在數據應用的經歷

要想更進一步去審視關於「本質」類當中我所缺乏的東西,還是要回到我過去在資料科學中學習並確實在專案中使用過的框架,一般稱為數據分析流程:

從每個步驟我在實務經驗中總結出自己缺乏的東西。


我在ASK中所缺乏的東西

簡單說明一下過去我在ASK這個步驟所採過的坑,ASK最主要的就是根據一些痛點或現況做問題的定義,所以實務上會根據用戶或使用者(以下通稱為User)的問題去做整理,而我過去的方式就是做需求訪談。

需求訪談說簡單也簡單,畢竟就是了解User實際的問題;但有時產生的困難點就在於User可能自己也不清楚問題點所在,又或者搞錯方向,因此很容易在後續流程中發現問題錯誤或沒解決到實際問題,從而又回到最開始ASK步驟重新導正方向。

當然數據分析流程本身並非線性一路走到底,也是常會經歷小循環來微調,例如從數據中發現資料缺漏、數據輪廓發現與現實產生差異等,都是可循環回ASK步驟再次與User進行確認,因為某些確實牽涉到專業領域的知識,當資料分析師對於專業領域的理解不深時,難以第一時間針對許多細節進行處理。例如對工廠流水線不熟悉的分析師,對於流水線各站點的產出與檢測時間實務上可能產生時間誤差就會有所疑問。

那在ASK步驟中我所總結對於自己缺乏的「本質」類問題是什麼呢?我想應該是:「對於User敘述的理解」

《使用數據的技術》一書中給了我些許靈感,它利用一些方法論針對於User白話敘述進行語句拆解問題,並將拆解後的結果與數據進行對照,進而分析數據。這與我在《Google Data Analytics》線上課程中學到的一些關於ASK該做的例如Checklist等方式有異曲同工之妙。


進一步來講

但這感覺仍不夠,因為在我實際運用當中發現到我對於拆解語句後去對應數據仍侷限在User提供的敘述範圍內,也就是說前面提到的「User搞不懂自己真正的問題」這件事仍然無法解決。

所以進一步思考的問題就是:「如果判斷出User提出的問題是真問題?」以及「其背後是否隱含其它問題?」

那麼就來到我所總結自己缺乏的問題,那就是:

閱讀與理解

這是一種軟技能,也是大家認為很重要卻很容易忽視的能力,因為每個人在求學階段中都有意無意的增強此技能,但又不會刻意追求達到一個比較具體的點,就像數學考試中,人們往往不是因為數學公式不會而是看不懂題目敘述的問題一樣。我想在數據應用的第一個步驟,也是最重要的步驟,我該增強的重點應該在此。


我具體該怎麼做?

對於「本質」類的問題要克服,我想不同於「工具」類可以在短期上手,閱讀理解是需要通過長期的培養來成長,當然也不僅僅是通過一般零散的閱讀就能達成,仍須透過一些在閱讀理解的方法論進行更加系統的培養。

因此在接下來一段時間中,我會在Blog中「閱讀有感」與「資料科學」類別中盡可能的分享紀錄我培養與學習的路徑。

方向包含闡述閱讀理解的相關書籍,以及線上學習材料兩部分。

相關書籍會在閱讀後記錄在「閱讀有感」類別中,初期系統學習以3本為開始,後續不定期、不定數量,盡量分享對我有啟發的書籍;

線上學習則會記錄在「資料科學」類別中,線上學習材料例如「得到APP」有一門我認為不錯的「吳軍·閱讀與寫作50講」將作為我學習的起始,當然礙於版權問題,我將以紀錄自己學習的心得為主,偶有感觸的部分內容為輔,不會完全闡述課程內容。

Leave a Comment