<acronym id="8i2ay"><center id="8i2ay"></center></acronym>
<acronym id="8i2ay"><center id="8i2ay"></center></acronym>
<acronym id="8i2ay"></acronym>
<acronym id="8i2ay"><div id="8i2ay"></div></acronym><rt id="8i2ay"><small id="8i2ay"></small></rt>
<acronym id="8i2ay"><center id="8i2ay"></center></acronym>
學生工作
HIT智能數據俱樂部

一、科創俱樂部簡介

哈爾濱工業大學計算學部HIT智能數據俱樂部(HIT Artificial Intelligent & Database Club)俱樂部成立于2013年9月,是在學院及海量數據計算研究中心王宏志老師的指導下,哈工大大數據集團贊助下獨立開展工作的學生組織,是切實為廣大同學們服務的團體。俱樂部以“開拓創新,銳意進取”為指導思想,“培養大數據和人工智能方向人才”為宗旨,與時俱進,積極扎實地開展各項學術類、技術類及綜合類活動,不斷開拓新思路、著力搭建開展大數據及AI研究及開發的新平臺、努力開創數據技術和人工智能的新局面、抓住大數據方向的黃金機遇期、不斷取得突破。在這里我們有一流的師資指導,經驗豐富的學長學姐,業界領先的實用技術,這里有學科前沿的技術訓練營,新穎的創意競賽。

二、俱樂部指導教師簡介

指導教師:王宏志教授。博士生導師、英才學院副院長,龍江學者青年學者、黑龍江省青年科技獎得主、CCF優秀博士論文得主、教育部高等學校計算機類專業教學指導委員會計算機系統專家委員會委員、中國計算機學會學術工作委員會委員、中國計算機學會數據庫專業委員會常務委員、ACM SIGMOD China秘書長、CCF哈爾濱分部副主席、微軟學者、中國優秀數據庫工程師。研究方向為數據庫、大數據管理與分析、大數據治理等,發表論文300余篇,SCI收錄80余次,他引1800余次,先后主持國家自然科學基金重點項目、國際合作項目等10余項項目,以主要成員參與973項目、863項目、國家重點研發計劃項目、國家自然科學基金重點項目以及一批省部級重點項目和多項國際合作項目等。 

海量數據計算研究中心簡介:隨著計算機和網絡技術的蓬勃發展,大數據一詞已經越來越多地被提及,國內已有超過200所高校被批準開設數據科學相關專業。在這個信息爆炸的時代,海量數據已經與我們的生活息息相關,它決定著一個企業、機構甚至國家的未來?,F如今,任何一個領域的決策都將日益基于數據和分析做出,而非基于經驗和直覺。哈爾濱工業大學計算機學院海量數據計算研究中心緊握大數據時代的脈搏,依托教育部“海量數據計算理論與技術”創新團隊,黑龍江省大數據計算重點實驗室和哈爾濱工業大學國際大數據計算研究中心,科學研究和工程開發工作圍繞著大數據的采集、傳輸、存儲、計算、挖掘等方面,是大數據的海洋中眾多探尋者中的一支精英力量。實驗室研究方向包括:大數據計算理論、大數據計算的算法設計方法、大數據質量管理的理論與方法、物聯網感知大數據獲取與分布式計算的理論與算法、大數據計算問題求解的理論和方法、支撐人工智能的大數據技術(DB4AI)、智能大數據管理與分析理論與技術(AI4DB)、大數據分析與挖掘的理論與技術、大數據管理與服務平臺、面向應用(工業、電信、醫療等)的大數據計算理論與算法、面向無人系統的數據分析與算法設計。

三、俱樂部主要成員簡介

俱樂部現有成員20余人。均在海量數據計算研究中心的各大項目中擔任重要工作。

俱樂部現任主要成員簡介:

畢研恒:俱樂部主席,2017級本科生,2021級直博生,導師為王宏志教授。主要研究方向為NAS(neural architecture search)、圖神經網絡。

鄭勝文:俱樂部副主席,2017級本科生,2021級碩士,導師為王宏志教授。主要研究方向為Auto_ML、電網、圖神經網絡。2019年獲得大學生年度創新項目省級一等獎。在校期間多次獲得英才學院人民獎學金。

 

往屆成員簡介(部分優秀學長學姐):

梁志宇:2018級博士,主要研究方向為工業大數據。

穆添愉:2019年3月——2020年9月任俱樂部主席。主要研究方向為NAS(neural architecture search)、算法自動選擇。

高天鵬:2017級碩士,導師為李建中教授。

王春楠:2018年3月——2019年3月任俱樂部主席。2017級博士,主要研究方向為NAS(neural architecture search)、Auto_ML。

安宏展:2016級本科?,F就職于快手。

萬曉瓏:2018級博士。研究方向為知識圖譜。

齊志鑫:2017年3月——2018年3月任俱樂部主席。2016級碩士、2018級博士。研究方向為知識圖譜、時間序列。

丁曉鷗:2018級博士,研究方向為工業大數據、知識圖譜。

四、俱樂部所獲榮譽獎項

專利作品:

1. 王宏志, 周游, 楊東華, 高宏, 齊志鑫. 關系模式的自動轉換方法、裝置及存儲介質. 專利號: ZL201810498633.8 授權號: CN108776673B 授權日: 2020.08.18
2. 王宏志, 李天寶, 齊志鑫, 童超宇, 李戰懷, 彭智勇, 王國仁. 面向海量異構數據的模式集成方法及裝置. 專利號: ZL201711116061.4 授權號: CN107808001B 授權日: 2019.12.06
3. 王宏志, 尹薇, 齊志鑫, 高宏. 一種針對時間序列的異常值修復方法及裝置. 公開號: CN109063145A 公開日: 2018.12.21
4. 王宏志, 宋揚, 齊志鑫. 一種基于LSTM網絡的數據預測模型調優方法及裝置. 公開號: CN108764568A 公開日: 2018.11.06
5. 王宏志, 魏延杰, 齊志鑫, 高宏. 基于條件隨機場與Stacking算法的時間序列預測方法和裝置. 公開號: CN108596398A 公開日: 2018.09.28
6. 王宏志, 孟凡山, 齊志鑫, 高宏. 一種基于特征采樣的時間序列分類方法及裝置. 公開號: CN108573059A 公開日: 2018.09.25
7. 王宏志, 孫銘, 齊志鑫, 高宏. 數據分類方法、裝置及存儲介質. 公開號: CN108564137A 公開日: 2018.09.21
8. 王宏志, 孫穎凱, 鄭博, 梁棟, 齊志鑫. 一種確定圖數據存儲結構的方法和裝置. 公開號: CN111708923A 公開日: 2020.09.25
9. 王宏志, 鄒開發, 鄭博, 梁棟, 齊志鑫. SparQL查詢語句的預測方法和裝置. 公開號: CN111723106A 公開日: 2020.09.29
10. 王宏志, 歐陽俊飛, 鄭博, 梁棟, 齊志鑫. 一種生成數據庫索引的方法和裝置. 公開號: CN111723076A 公開日: 2020.09.29

論文專著:

Chunnan Wang, Hongzhi Wang, Tianyu Mu, Jianzhong Li, Hong Gao:
AutoModel: Utilizing Research Papers and HPO Techniques to Deal with the CASH problem. ICDE 2020: 1906-1909


Bozhou Chen, Kaixin Zhang, Longshen Ou, Chenmin Ba, Hongzhi Wang, Chunnan Wang:
Automatic Hyper-Parameter Optimization Based on Mapping Discovery from Data to HyperParameters.

CoRR abs/2003.01751 (2020)


Chunnan Wang, Hongzhi Wang, Guocheng Feng, Fei Geng:
MultiObjective Neural Architecture Search Based on Diverse Structures and Adaptive Recommendation. 

CoRR abs/2007.02749 (2020)


Tianyu Mu, Hongzhi Wang, Chunnan Wang, Zheng Liang:
Auto-CASH: Autonomous Classification Algorithm Selection with Deep QNetwork. 

CoRR abs/2007.03254 (2020)


Chunnan Wang, Hongzhi Wang, Tianyu Mu, Jianzhong Li, Hong Gao:
AutoModel: Utilizing Research Papers and HPO Techniques to Deal with the CASH problem. 

CoRR abs/1910.10902 (2019)

 

Zhiyu Liang, Hongzhi Wang, Jianzhong Li, Hong Gao:
IMOptimizer: An Online Interactive Parameter Optimization System Based on Big Data.

DASFAA (3) 2019: 581-584

 

Zhiyu Liang, Hongzhi Wang, Jijia Yang:
STRATEGY: A Flexible Job-Shop Scheduling System for Large-Scale Complex Products. 

DASFAA (3) 2020: 766-770

 

Zhiyu Liang, Hongzhi Wang, Hao Zhang, Hengyu Guo:
GMDA: An Automatic Data Analysis System for Industrial Production. 

DASFAA (3) 2020: 780-784

 

 

五、俱樂部場地和資金支持或與企業、實驗中心對接情況

1.與研究中心對接項目——工業大數據:

工業大數據是指在工業領域中,圍繞典型智能制造模式,從客戶需求到銷售、訂單、計劃、研發、設計、工藝、制造、采購、供應、庫存、發貨和交付、售后服務、運維、報廢或回收再制造等整個產品全生命周期各個環節所產生的各類數據及相關技術和應用的總稱。其以產品數據為核心,極大延展了傳統工業數據范圍,同時還包括工業大數據相關技術和應用。

1)重要性:

制造強國戰略文件《中國制造2025》明確指出:工業大數據是我國制造業轉型升級的重要戰略資源,戰略任務包括:加快推動新一代信息技術與制造技術融合發展,把智能制造作為兩化深度融合的主攻方向。工業大數據是工業互聯網的核心,是工業智能化發展的基礎原料。工業大數據分析具有重大戰略價值。

2)相關研究方向:

Cleanits工業大數據清洗系統:

在關系型時態數據上多種錯誤的綜合清洗,理論論文錯誤共生關聯關系,提出綜合性清洗策略。是國內外首個解決“不完整、不一致、時序不清的綜合性數據清洗”方法的工作,在大數據時效性研究上取得國際領先進展。真實數據的實驗表明,本方法的修復質量和效率均優于已有的領先修復方法。

時序數據值異常的檢測和修復:

針對工業大數據的獨有特點,首先提出工業大數據相關性計算模型,實現從數據中提取信息進行知識推理。提出基于相關性圖模型的異常檢測方法,實現對模式多樣的工業大數據的智能化、全面性的異常與錯誤數據檢測,有效減少對異常實例的誤判和漏判。

2.算法自動選擇和神經架構搜索研究及系統設計:

1)算法自動選擇:

算法自動選擇(Algorithm Selection,簡稱AS)是一種根據自動選擇合適機器學習算法的技術,可以通過算法根據任務特征自動從已有算法中挑選出最適合的機器學習算法。這可以有效的提升解決任務的能力,降低機器學習的使用成本。該技術可以降低機器學習的門檻,有助于非專業人員更容易地使用機器學習技術。

算法自動選擇是指當我們遇到一系列問題實例需要處理時,我們不再依賴于有相關經驗的專家,而是讓計算機自動(沒有任何的人工干預)地幫助我們快速的選擇出效果最好的模型或算法來解決問題。目前應用最多的場景就是靜態閉環AutoML。在給定數據和度量標準之后,通過AutoML選擇出效果最好的模型。該過程沒有任何人工干預,都是算法自動選擇的。


當今時代,許多不同的領域都對從數據中學習有很大的興趣,比如銀行、生物信息學、商業、農業、教育等領域。而進行數據挖掘從數據中提取信息則需要使用大量的機器學習算法。這也促使了眾多的學習算法的誕生,但是,研究表明不存在一個在任何情況下都是最優的算法,因此我們就需要針對不同情況選擇不同的算法。

當我們選擇算法時,一般的做法要么是使用數據進行幾組算法的實驗,要么從機器學習專家那里獲得建議,但是這些算法并不總是切合實際的,前者需要耗費很多時間和精力,后者又無法保證有那么多的專業人士,所以我們就需要計算機能夠自行根據問題特征選擇合適的機器學習算法。所以這樣看來,機器學習算法的自動選擇有重要意義。

2)神經網絡搜索

神經結構搜索(Neural Architecture Search,簡稱NAS)是一種自動設計神經網絡的技術,可以通過算法根據樣本集自動設計出高性能的網絡結構。在某些任務上甚至可以媲美人類專家的水準,甚至發現某些人類之前未曾提出的網絡結構,這可以有效的降低神經網絡的使用和實現成本。該技術可以降低深度學習的門檻,有助于研究人員和從業人員更容易地使用深度學習。

神經網絡架構搜索NAS(Neural Architecture Search)是一種搜索最佳神經網絡構架的算法。在神經網絡模型算法中,大多數會定義一組可能用于網絡的“構建塊”,在NAS算法中,控制器遞歸神經網絡(RNN)對這些構建塊進行采樣,將它們組合在一起以創建某種端到端模型。然后對這種新的網絡架構進行訓練以使得模型收斂,并在驗證集上保持獲得一些準確性,由此產生的精度可以用于更新控制器,以便控制器隨著時間的推移產生更好的架構,可能選擇出更好的構建塊或更好的組合方式,使用策略梯度更新控制器權重。


  簡單來說就是讓算法抓住不同的構建塊并將這些塊放在一起構成一個網絡,然后訓練并且測試該網絡,之后根據模型的結果,調整用于制作網絡的構建塊和組合方式。

六、俱樂部活動計劃

技術分享和學術討論:對與俱樂部相關的項目所涉及到的技術進行技術分享。主要請參與相關項目的學長學姐對學弟學妹們進行技術的介紹,帶領學弟學妹們體驗一下前沿的技術。并組織學生對先進的學術問題,高難度學術論文進行學術研討,共同研究如何創新。

參與實驗室項目:對于那些對實驗室項目感興趣的同學,俱樂部的同學們會帶領他們一起實際參加項目,讓他們真正參與到項目的工作中來,并且可以根據突出表現發表論文或者獲取專利。

七、俱樂部招新計劃

面向所有學生招新,不限專業、年級,只要你對我們的俱樂部感興趣,我們就歡迎你們的加入。

招新QQ群:1163047454

 


亚洲第一A在线网站,亚洲全国最大的人成网站,亚洲人成全部网站在线播放