新加坡國立大學(xué)數(shù)據(jù)科學(xué)與機器學(xué)習(xí)理學(xué)碩士項目(以下簡稱DSML碩士項目)每年招生1次。本次,項目學(xué)術(shù)主任張洛欣教授將回答申請人提出的部分問題,對于專業(yè)申請感興趣的學(xué)生可以了解一下。
問1:許多著名大學(xué)都開設(shè)了數(shù)據(jù)科學(xué)相關(guān)的碩士項目,新國大DSML碩士項目的優(yōu)勢是什么?
答:是的,現(xiàn)在對數(shù)據(jù)科學(xué)的畢業(yè)生需求量很大,所以每個一流大學(xué)都有與數(shù)據(jù)科學(xué)有關(guān)的專業(yè)、碩士項目。我們項目的優(yōu)勢是理論和實踐兼顧,提供數(shù)據(jù)科學(xué)多個專業(yè)的訓(xùn)練,以及強大的授課團隊。另外,新加坡非常重視城市的數(shù)據(jù)化和智慧化,這提供了良好的實習(xí)環(huán)境。
問2:DSML碩士和計算機碩士-人工智能(AI)專業(yè)的學(xué)習(xí)內(nèi)容差別大么?
答:兩個項目有區(qū)別。人工智能離不開數(shù)據(jù)處理,數(shù)據(jù)處理會用到AI和機器學(xué)習(xí)的知識和工具。但是,人工智能更注重人類認知的非數(shù)據(jù)計算化,比如你怎么用計算機程序控制機器人去模仿人類的行為,如何證明數(shù)學(xué)定理等等,這些都跟數(shù)據(jù)分析無關(guān),是基于非數(shù)據(jù)的認知和推理;數(shù)據(jù)科學(xué)的推理和論斷,則是基于數(shù)據(jù)分析的,DSML碩士項目中涉及的機器學(xué)習(xí)和AI內(nèi)容是為了支持對數(shù)據(jù)的分析。
問3:DSML碩士項目的學(xué)習(xí)對編程技能的要求是什么?Python,R,JAVA,Julia,MatLab?
答:我們希望進來學(xué)習(xí)的同學(xué)有良好的編程基礎(chǔ)。數(shù)據(jù)科學(xué)在用戶端常用的編程語言是Python和R,JAVA是另一個重要編程語言。Julia和MatLab主要用于數(shù)值計算,目前我們不要求學(xué)生掌握。
問4:那么我在申請的時候就要會Python么?這是錄取條件么?
答:我們在錄取條件中不要求學(xué)生會Python。但是,課程一開始就要使用Python,而且要求比較高。
比如,我教授的DSA5101工業(yè)大數(shù)據(jù)概論這門課,就有做編程項目的。我們可以體會到缺乏編程基礎(chǔ)的學(xué)生的難處,比如我自己本科是數(shù)學(xué)專業(yè)的,研究生轉(zhuǎn)到計算機科學(xué)的時候,編程也是很困難的。因為計算機科學(xué)不同于數(shù)學(xué)思維,不是理解就夠了,而是要求學(xué)生記得protocol等等很多東西。為了更好地適應(yīng)課堂,建議我們的學(xué)生在課程開始前去提高自己的Python技術(shù)。
問5:首屆錄取的學(xué)生院校和專業(yè)背景分布情況如何?
答:首屆共招收了62名學(xué)生,其中中國學(xué)生有45名。我們的錄取建立在競爭基礎(chǔ)上,首屆來自中國高校的學(xué)生均畢業(yè)于“985”、“211”大學(xué)。從專業(yè)分布上看,大約1/3學(xué)生是數(shù)學(xué)系、統(tǒng)計系畢業(yè)的,其他2/3的學(xué)生來自工科專業(yè)。
問6:來自不同專業(yè)、受不同訓(xùn)練的學(xué)生進入課程以后,教學(xué)如何平衡呢?
答:來自不同背景的學(xué)生各有強項和弱項,對問題的看法往往也不同,這確實給教學(xué)帶來一些困難。但我們的授課團隊里有一批從事交叉學(xué)科研究的老師,這些老師有豐富的教學(xué)經(jīng)驗。我們的老師會提供各種閱讀材料、視頻等等,讓不同背景的學(xué)生選擇閱讀和觀看,以便快速掌握所需要的知識。另外,我們還會用各種例子來解釋困難的技術(shù)術(shù)語,保證所講的內(nèi)容沒有缺口。
問7:我們課程中使用的數(shù)據(jù)案例的來源是?
答:我們目前上課使用的數(shù)據(jù)案例大部分來自公共數(shù)據(jù)資源,例如kaggle是其中的一個數(shù)據(jù)資源庫。一小部分資源來自老師們自己的科研合作項目,例如我上課時會用到一些我們用的癌癥研究的數(shù)據(jù)、COVID-19相關(guān)數(shù)據(jù)等等。
問8 DSA5201工業(yè)咨詢和應(yīng)用項目是一門怎樣的課程?可以多介紹一點么?
答:這門課要求學(xué)生到公司里做數(shù)據(jù)分析課題或者加入到某個科研小組從事科研項目。一次實習(xí)項目開展的周期最低為10周(每周15個小時),實習(xí)公司可以在新加坡,也可以在海外。
我們非常鼓勵學(xué)生積極參加工業(yè)實習(xí)和科研項目,也引導(dǎo)他們嘗試自己尋找實習(xí)單位,自主申報實習(xí)項目,以鍛煉對外溝通的能力。我們也有合作的機構(gòu)和部門,會給學(xué)生牽線一些數(shù)據(jù)科學(xué)方面的實習(xí)機會。
關(guān)于實習(xí)的評估,實習(xí)期間每2周有progress report,實習(xí)結(jié)束時有總的項目報告,讓學(xué)生匯報實習(xí)成果,由實習(xí)公司的supervisor和學(xué)校里負責實習(xí)項目的老師共同評估。
問9:除了DSA5201中的實習(xí),項目里還有其他的實習(xí)、交流機會么?
答:有的選修課可能會有和外部企業(yè)合作的機會,但這以授課老師的安排為準。
問10:DSML項目和新國大數(shù)據(jù)科學(xué)研究所(Institute of Data Science)有哪些合作?
答:目前我們的授課教師團隊中有新國大數(shù)據(jù)研究院的科研人員。另外,我們也正在尋求其它方面的合作。例如,如何安排我們的學(xué)生到數(shù)據(jù)研究院的科研小組里實習(xí),以及共同舉辦數(shù)據(jù)科學(xué)研討會等等。
問11:新冠疫情期間,很多人注意到數(shù)據(jù)科學(xué)在公共衛(wèi)生領(lǐng)域發(fā)揮的重要作用,我是公共衛(wèi)生背景的學(xué)生,可以申請么?
答:具有統(tǒng)計基礎(chǔ)的公共衛(wèi)生專業(yè)的學(xué)生可以申請的。如果你被錄取的話,其實現(xiàn)在醫(yī)院有很多數(shù)據(jù)科學(xué)的問題,比如病人的病例存儲、記錄,其實都是需要數(shù)據(jù)科學(xué)的,醫(yī)院我覺得是我們一個很大的就業(yè)領(lǐng)域。
問12:如果畢業(yè)后選擇回到中國就業(yè),前景如何?
答:中國就業(yè)市場對數(shù)據(jù)科學(xué)人才的需求是很大的。比如說,中國現(xiàn)在的線上購物等電子商務(wù)開展得非常好,比北美都好很多,線上支付、購物幾乎人人都會,用戶群體很大。這樣就促使很多大公司,比如騰訊、阿里巴巴去雇傭更多數(shù)據(jù)分析專家,支持它們的業(yè)務(wù)發(fā)展。