connor (leafwind)
從資料科學到資料工程、從台灣到日本的學習歷程
資工系+資工所
Appier 軟體工程師 2014 - 2019
Data Science (2y)
Data Engineering/Backend (3y)
SmartNews 軟體工程師 2019 - 2020
Data Engineering
資料科學到資料工程
十年前就在做 AI,AI 紅了之後反而做工程
Project Management
Mentor, Scrum Master
資料科學的理想與現實
最容易被忽略的職涯風險
ref: 《資料科學角色光譜圖》
ref: 資料科學的職稱分類演進
對老闆來說,不管你的職位叫什麼
你就是產品,產品就是你
domain knowledge => feature engineering
rule based (decision tree, statistical history)
evaluation?maybe.
(草創時期,一人一條龍)
ref: 為何資料工程人才難以培養?
A mature system might end up being (at most) 5% machine learning code and (at least) 95% glue code — "Hidden Technical Debt in Machine Learning Systems", Sculley, NIPS 2015
business problem (vertical) vs. generalized platform/solution (horizontal)
大平台
平台
平台
應用
應用
開發模型與開發軟體的差別
跨團隊合作經驗
一個人什麼都做不了
小組織 vs. 大公司的合作模式完全不同
領域知識
feature, feature, feature!
應用模型的實務經驗
太多現實問題,影響因素政治>>工程>>科學
客戶買不買單是另一回事
一開始:不知道問題是什麼、資料是什麼
要試多少 feature/model?做到多好才算完成?
Accuracy 100%?有更緊急專案的出現
Cold Start 成效差,要多久才能收集足夠資料?
根據統計與檢定直到客戶不抱怨為止
Sprint 一次多長?
Task: 測試 A 模型、測試 B 模型、測試 C 模型...
兩週不夠再兩週?
有時候跑看板更實際
ref: 為什麼資料科學「曾經」比資料工程流行?
讀 paper 研究機器學習模型實作的科學家
五分鐘嘗試第一個深度學習(Caffe)
60分鐘入門PyTorch
一條龍科學家是要科學家扛 95% 工程活
科學
工程
MLOps
Dragon Scientiest
(選主要的經驗即可)
比起公司的風險,自己的職涯風險更大
資料科學、資料工程、後端、專案管理都碰過
但並不專精
工程師同事認為我是科學家
科學家同事也認為我比他們懂工程
完成工作也幫助團隊,卻常常陷入冒牌者症候群
台灣與日本的職缺觀察
人在台灣,想找日本工作
人在台灣,想找日本以外的國家工作
人在台灣,暫時不會離開目前國家
已經在國外,但想換國家
已經在國外,暫時不會離開目前國家
訂閱文章通知
不定時更新