- 關(guān)于我們
- 針對假冒留學(xué)監(jiān)理網(wǎng)的聲明
- 留學(xué)熱線:4000-315-285
留學(xué)中介口碑查詢
項目背景
當(dāng)你發(fā)現(xiàn)刷抖音停不下來,當(dāng)你在朋友圈里看到精準(zhǔn)的廣告投放,當(dāng)你讓Siri規(guī)劃回家路線,這背后的強大驅(qū)動力便是數(shù)據(jù)挖掘與機器學(xué)習(xí)。數(shù)據(jù)挖掘又稱知識發(fā)現(xiàn),即從數(shù)據(jù)中挖掘知識。在當(dāng)下信息爆炸時代,面對龐大的數(shù)據(jù)庫,最主要的困難就是有效信息難以提煉, John Nalsbert稱之為“信息豐富而知識貧乏”窘境。因此,對海量數(shù)據(jù)進行深入分析,發(fā)現(xiàn)并提取隱藏在其中的信息,以更好地利用這些數(shù)據(jù)的需求愈發(fā)強烈。但僅以數(shù)據(jù)庫系統(tǒng)的錄入、查詢、統(tǒng)計等功能,無法發(fā)現(xiàn)數(shù)據(jù)中存在的關(guān)系和規(guī)則,無法根據(jù)現(xiàn)有的數(shù)據(jù)預(yù)測未來的發(fā)展趨勢,更缺乏挖掘數(shù)據(jù)背后隱藏知識的手段。正是在這樣的條件下,數(shù)據(jù)挖掘技術(shù)應(yīng)運而生。項目將圍繞數(shù)據(jù)挖掘原理及其在推薦系統(tǒng)中的應(yīng)用展開。
項目介紹
項目中,導(dǎo)師將介紹用于知識發(fā)現(xiàn)的大數(shù)據(jù)挖掘的基礎(chǔ)編程模型和算法。學(xué)生對其代碼實現(xiàn)后,將使用真實生活中的數(shù)據(jù)集(如Yelp評論、亞馬遜交易和MovieLens數(shù)據(jù)等)進行模型訓(xùn)練,并檢測出有意義的用戶偏好及習(xí)慣。在項目中后期,學(xué)生將結(jié)合所學(xué)知識及導(dǎo)師建議對基礎(chǔ)推薦算法及模型進一步優(yōu)化研究,構(gòu)建一個新穎、準(zhǔn)確且高效的個性化推薦系統(tǒng),并在項目結(jié)束時提交項目報告、進行成果展
個性化研究課題參考
構(gòu)建基于內(nèi)容的電影推薦系統(tǒng)
構(gòu)建基于協(xié)同過濾的推薦系統(tǒng)
構(gòu)建一個混合位置的餐廳推薦系統(tǒng)
數(shù)據(jù)挖掘其他應(yīng)用如:使用公開數(shù)據(jù)進行空氣質(zhì)量預(yù)測和預(yù)報
適合人群
高中生/大學(xué)生
數(shù)據(jù)科學(xué)、機器學(xué)習(xí)、計算機科學(xué)、軟件工程、數(shù)學(xué)等專業(yè)方向或者對上述方向感興趣的學(xué)生; 學(xué)生需要掌握線性代數(shù)及概率論與數(shù)理統(tǒng)計知識,至少熟練使用一門編程語言并修讀過算法與數(shù)據(jù)結(jié)構(gòu),有數(shù)據(jù)分析項目相關(guān)經(jīng)驗的申請者優(yōu)先
導(dǎo)師介紹
南加州大學(xué) 終身教授
Yao-yi導(dǎo)師現(xiàn)任南加州大學(xué)空間科學(xué)終身教授,空間計算實驗室主任,南加州大學(xué)(USC)美國國家科學(xué)基金會綜合媒體系統(tǒng)中心(IMSC)副主任。導(dǎo)師同時在南加州大學(xué)維特比數(shù)據(jù)科學(xué)碩士項目中擔(dān)任教學(xué)工作。導(dǎo)師目前的研究將空間科學(xué)理論與計算機算法相結(jié)合,從異構(gòu)數(shù)據(jù)中發(fā)現(xiàn)新見解,以解決現(xiàn)實世界的問題。他的研究興趣包括信息集成、機器學(xué)習(xí)、數(shù)據(jù)挖掘、計算機視覺和知識圖譜。他獲得了來自諸如NSF、NIH、DARPA、NGA和NEH等機構(gòu)的資金。導(dǎo)師曾在谷歌AI (NYC)進行研究,并曾就職Facebook空間計算小組的機器學(xué)習(xí)顧問。
任職學(xué)校
南加州大學(xué)(University of Southern California,USC)創(chuàng)立于1880年,坐落于美國加州洛杉磯市中心,是全球領(lǐng)先私立研究型大學(xué),美國最具多元化學(xué)府之一,廣受全球博才智杰推崇。南加州大學(xué)是美國大學(xué)協(xié)會(AAU;研究型大學(xué)聯(lián)盟,會員門檻極高,被許多機構(gòu)視為衡量大學(xué)學(xué)術(shù)研究和品質(zhì)的基準(zhǔn))的成員,在2020年U.S.News全美大學(xué)數(shù)據(jù)科學(xué)專業(yè)排名Top7。
項目大綱
面向大規(guī)模數(shù)據(jù)處理的并行計算模型和方法
頻繁項級挖掘算法及關(guān)聯(lián)規(guī)則
聚類分類與數(shù)據(jù)降維
推薦系統(tǒng)
學(xué)術(shù)研討1:教授與各組學(xué)生探討并評估個性化研究課題可行性,幫助學(xué)生明晰后續(xù)科研思路
學(xué)術(shù)研討2:學(xué)生將在本周課前完成程序設(shè)計原型(prototype)及偽代碼(Pseudocode),教授將根據(jù)各組進度進行個性化指導(dǎo),確保學(xué)生優(yōu)質(zhì)的終期課題產(chǎn)出
項目成果展示
論文輔導(dǎo)
時間安排與收獲
7周在線小組科研學(xué)習(xí)+5周論文輔導(dǎo)學(xué)習(xí) 共125課時
學(xué)術(shù)報告
優(yōu)秀學(xué)員獲主導(dǎo)師Reference Letter
EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等級別索引國際會議全文投遞與發(fā)表(可用于申請)
結(jié)業(yè)證書
成績單