Re: [請益] 徵大數據課程心得

看板 Soft_Job
作者 backprog (back-propagation)
時間 2017-04-02 16:19:11
留言 11則留言 (8推 0噓 3→)

我目前從事資料科學相關工作, 時間分配上,扣除泡咖啡、開會、喇賽等等時間以後 95% Data mining(包含資料視覺化)、5% Machine Learning 以下是我的大數據課程心得: -- [機器學習 3學分] 最早在學校修這門課的時候,不知道需要什麼先備知識。 沒有機率、統計等基礎就傻傻跑去修, 線代只學過工程數學那些,而且還忘得差不多了... 結果,除了 k-mean 以外什麼都沒學到,所以就被當了。 -- 之後,我把田神的 HW0 拿來做, 想說:「寫出這些題目,應該就有捲土重來的本錢了吧...」 當時 HW0 都是找某位經濟系的同學請教才弄懂,給我看的都是五專會統科的課本。 我跟她說:「天啊妳有超有做AI的天分,只要會寫程式的話就超強惹!」 結果,她現在跑去綠地球當空姐。 -- [Pattern Recognition 3學分] 然後,我覺得自己應該準備好了,就去修這門課。 選課前,我還拿著 HW0 問老師:「懂這些夠嗎?」 修課以後學到特徵、資料正規化、訓練集、測試集,交叉驗證等等觀念, 才慢慢建立起比較完整的資料科學觀念輪廓。 雖然考數學題的時候,成績還是很慘烈, 但是老師要求我們在紙上一步步推演 Perceptron 的運作過程, 推演完以後有一點點"奇妙的"感覺,但我說不清楚是什麼。 為了弄清楚,為了讓這個感覺更強烈,我用C++自幹出一個 Perceptron, 搭配 OpenCV 把過程視覺化。 跑訓練的時候,看著自己寫的 Perceptron 不停移動, 真的慢慢把兩類 sample set 切得越來愈開。 我第一次感到自己寫的程式有智慧,真的會自己發現些什麼,那種感動是難以言喻的~ 這門課還有學到貝氏機率、kNN、SVM 等其他模型, 以及升維、降維等等一些入門的特徵處理手法。 -- 當時深度學習在台灣還沒紅,至少在台灣學界並不是廣為人知的。 TensorFlow 也還沒出來。 之後更進階的東西我大多數都是靠自修、或者和朋友同事討論, 就沒再上過這種正式的課程,但修了 Pattern Recognition 應該是把我帶入門的關鍵。 -- 沒錯 在我深深的腦海中~~ 沒有不用,我只是把這兩樣當作 data mining 理所當然的一部分 homework 0
※ 批踢踢實業坊(ptt.cc), 來自: 180.177.53.142
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1491121154.A.C9F.html

gerojeng: 讚讚讚 04/02 17:10

cuteSquirrel: 推薦這篇文章。 04/02 18:48

ahahahahah: 猛 04/02 18:59

starcraftiii: 一般來說資料視覺化大概佔了七八成的時間 04/02 19:28

starcraftiii: 不然麻瓜會看不懂我們在做什麼 04/02 19:28

waterdisney: 經濟系同學的圖呢? 04/02 19:39

popxpopxpop: 推 04/02 20:01

kenshin528: 羨慕不用做 data clean 和 etl 04/03 00:58

spiderway: 那你就視覺化啊 04/03 00:59

angusyu: HWO是什麼? 04/03 02:24

a1982213: 給一下樓上 林軒田 homework 0 04/04 19:17

您可能感興趣