新加坡國立大學(xué)數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)理學(xué)碩士項(xiàng)目(以下簡稱DSML碩士項(xiàng)目)每年招生1次。本次,項(xiàng)目學(xué)術(shù)主任張洛欣教授將回答申請人提出的部分問題,對于專業(yè)申請感興趣的學(xué)生可以了解一下。
問1:許多著名大學(xué)都開設(shè)了數(shù)據(jù)科學(xué)相關(guān)的碩士項(xiàng)目,新國大DSML碩士項(xiàng)目的優(yōu)勢是什么?
答:是的,現(xiàn)在對數(shù)據(jù)科學(xué)的畢業(yè)生需求量很大,所以每個(gè)一流大學(xué)都有與數(shù)據(jù)科學(xué)有關(guān)的專業(yè)、碩士項(xiàng)目。我們項(xiàng)目的優(yōu)勢是理論和實(shí)踐兼顧,提供數(shù)據(jù)科學(xué)多個(gè)專業(yè)的訓(xùn)練,以及強(qiáng)大的授課團(tuán)隊(duì)。另外,新加坡非常重視城市的數(shù)據(jù)化和智慧化,這提供了良好的實(shí)習(xí)環(huán)境。
問2:DSML碩士和計(jì)算機(jī)碩士-人工智能(AI)專業(yè)的學(xué)習(xí)內(nèi)容差別大么?
答:兩個(gè)項(xiàng)目有區(qū)別。人工智能離不開數(shù)據(jù)處理,數(shù)據(jù)處理會用到AI和機(jī)器學(xué)習(xí)的知識和工具。但是,人工智能更注重人類認(rèn)知的非數(shù)據(jù)計(jì)算化,比如你怎么用計(jì)算機(jī)程序控制機(jī)器人去模仿人類的行為,如何證明數(shù)學(xué)定理等等,這些都跟數(shù)據(jù)分析無關(guān),是基于非數(shù)據(jù)的認(rèn)知和推理;數(shù)據(jù)科學(xué)的推理和論斷,則是基于數(shù)據(jù)分析的,DSML碩士項(xiàng)目中涉及的機(jī)器學(xué)習(xí)和AI內(nèi)容是為了支持對數(shù)據(jù)的分析。
問3:DSML碩士項(xiàng)目的學(xué)習(xí)對編程技能的要求是什么?Python,R,JAVA,Julia,MatLab?
答:我們希望進(jìn)來學(xué)習(xí)的同學(xué)有良好的編程基礎(chǔ)。數(shù)據(jù)科學(xué)在用戶端常用的編程語言是Python和R,JAVA是另一個(gè)重要編程語言。Julia和MatLab主要用于數(shù)值計(jì)算,目前我們不要求學(xué)生掌握。
問4:那么我在申請的時(shí)候就要會Python么?這是錄取條件么?
答:我們在錄取條件中不要求學(xué)生會Python。但是,課程一開始就要使用Python,而且要求比較高。
比如,我教授的DSA5101工業(yè)大數(shù)據(jù)概論這門課,就有做編程項(xiàng)目的。我們可以體會到缺乏編程基礎(chǔ)的學(xué)生的難處,比如我自己本科是數(shù)學(xué)專業(yè)的,研究生轉(zhuǎn)到計(jì)算機(jī)科學(xué)的時(shí)候,編程也是很困難的。因?yàn)橛?jì)算機(jī)科學(xué)不同于數(shù)學(xué)思維,不是理解就夠了,而是要求學(xué)生記得protocol等等很多東西。為了更好地適應(yīng)課堂,建議我們的學(xué)生在課程開始前去提高自己的Python技術(shù)。
問5:首屆錄取的學(xué)生院校和專業(yè)背景分布情況如何?
答:首屆共招收了62名學(xué)生,其中中國學(xué)生有45名。我們的錄取建立在競爭基礎(chǔ)上,首屆來自中國高校的學(xué)生均畢業(yè)于“985”、“211”大學(xué)。從專業(yè)分布上看,大約1/3學(xué)生是數(shù)學(xué)系、統(tǒng)計(jì)系畢業(yè)的,其他2/3的學(xué)生來自工科專業(yè)。
問6:來自不同專業(yè)、受不同訓(xùn)練的學(xué)生進(jìn)入課程以后,教學(xué)如何平衡呢?
答:來自不同背景的學(xué)生各有強(qiáng)項(xiàng)和弱項(xiàng),對問題的看法往往也不同,這確實(shí)給教學(xué)帶來一些困難。但我們的授課團(tuán)隊(duì)里有一批從事交叉學(xué)科研究的老師,這些老師有豐富的教學(xué)經(jīng)驗(yàn)。我們的老師會提供各種閱讀材料、視頻等等,讓不同背景的學(xué)生選擇閱讀和觀看,以便快速掌握所需要的知識。另外,我們還會用各種例子來解釋困難的技術(shù)術(shù)語,保證所講的內(nèi)容沒有缺口。
問7:我們課程中使用的數(shù)據(jù)案例的來源是?
答:我們目前上課使用的數(shù)據(jù)案例大部分來自公共數(shù)據(jù)資源,例如kaggle是其中的一個(gè)數(shù)據(jù)資源庫。一小部分資源來自老師們自己的科研合作項(xiàng)目,例如我上課時(shí)會用到一些我們用的癌癥研究的數(shù)據(jù)、COVID-19相關(guān)數(shù)據(jù)等等。
問8 DSA5201工業(yè)咨詢和應(yīng)用項(xiàng)目是一門怎樣的課程?可以多介紹一點(diǎn)么?
答:這門課要求學(xué)生到公司里做數(shù)據(jù)分析課題或者加入到某個(gè)科研小組從事科研項(xiàng)目。一次實(shí)習(xí)項(xiàng)目開展的周期最低為10周(每周15個(gè)小時(shí)),實(shí)習(xí)公司可以在新加坡,也可以在海外。
我們非常鼓勵(lì)學(xué)生積極參加工業(yè)實(shí)習(xí)和科研項(xiàng)目,也引導(dǎo)他們嘗試自己尋找實(shí)習(xí)單位,自主申報(bào)實(shí)習(xí)項(xiàng)目,以鍛煉對外溝通的能力。我們也有合作的機(jī)構(gòu)和部門,會給學(xué)生牽線一些數(shù)據(jù)科學(xué)方面的實(shí)習(xí)機(jī)會。
關(guān)于實(shí)習(xí)的評估,實(shí)習(xí)期間每2周有progress report,實(shí)習(xí)結(jié)束時(shí)有總的項(xiàng)目報(bào)告,讓學(xué)生匯報(bào)實(shí)習(xí)成果,由實(shí)習(xí)公司的supervisor和學(xué)校里負(fù)責(zé)實(shí)習(xí)項(xiàng)目的老師共同評估。
問9:除了DSA5201中的實(shí)習(xí),項(xiàng)目里還有其他的實(shí)習(xí)、交流機(jī)會么?
答:有的選修課可能會有和外部企業(yè)合作的機(jī)會,但這以授課老師的安排為準(zhǔn)。
問10:DSML項(xiàng)目和新國大數(shù)據(jù)科學(xué)研究所(Institute of Data Science)有哪些合作?
答:目前我們的授課教師團(tuán)隊(duì)中有新國大數(shù)據(jù)研究院的科研人員。另外,我們也正在尋求其它方面的合作。例如,如何安排我們的學(xué)生到數(shù)據(jù)研究院的科研小組里實(shí)習(xí),以及共同舉辦數(shù)據(jù)科學(xué)研討會等等。
問11:新冠疫情期間,很多人注意到數(shù)據(jù)科學(xué)在公共衛(wèi)生領(lǐng)域發(fā)揮的重要作用,我是公共衛(wèi)生背景的學(xué)生,可以申請么?
答:具有統(tǒng)計(jì)基礎(chǔ)的公共衛(wèi)生專業(yè)的學(xué)生可以申請的。如果你被錄取的話,其實(shí)現(xiàn)在醫(yī)院有很多數(shù)據(jù)科學(xué)的問題,比如病人的病例存儲、記錄,其實(shí)都是需要數(shù)據(jù)科學(xué)的,醫(yī)院我覺得是我們一個(gè)很大的就業(yè)領(lǐng)域。
問12:如果畢業(yè)后選擇回到中國就業(yè),前景如何?
答:中國就業(yè)市場對數(shù)據(jù)科學(xué)人才的需求是很大的。比如說,中國現(xiàn)在的線上購物等電子商務(wù)開展得非常好,比北美都好很多,線上支付、購物幾乎人人都會,用戶群體很大。這樣就促使很多大公司,比如騰訊、阿里巴巴去雇傭更多數(shù)據(jù)分析專家,支持它們的業(yè)務(wù)發(fā)展。