- R0
- 第 1 天,10:50‑11:20
- 中文演講/英文投影片
- 資料分析
- 中階
淺嚐LHCb數據分析的滋味 Play around the LHCb Data on Kaggle with SK-Learn and MatPlotLib
LHC實驗是現今粒子物理實驗的最先端,2012年所發現的希格斯粒子更是物理界的一大盛事。繼Atlas實驗在Kaggle公開Higgs挑戰之後,另一個LHC的LHCb實驗也將實驗數據搬上了Kaggle平台。本講題將簡介背後的實驗,並使用LHCb的數據以SciKit-Learn進行多維度數據分析與使用MatPlotLib視覺化。
演講詳細內容
位於瑞法邊境的歐洲粒子研究機構CERN,除了是WWW的發源地,也是現今粒子物理研究的前沿,LHC實驗的所在地。隨著2012年希格司粒子的發現,成就了2013年的諾貝爾物理學獎,其背後支撐的其實是龐大的巨量數據處理與分析。繼Atlas實驗在Kaggle平台以模擬數據公開徵求分析高手來挑戰外,LHCb實驗也在先前提供了一部份的真實實驗數據,讓非相關研究人員也可以嘗試尋找可能的新物理。最新的熱門話題,更是數週前LHCb實驗發表了五個前所未見的新複合粒子態。
本講題以LHCb的Kaggle挑戰所提供的實驗數據,使用python的sk-learn套件中幾個常用的機器學習演算法,來進行多維特徵的資料分析。同時探討在實際從事分析時,所需要注意的一些要點。並且示範使用matplotlib來將數據中的一些特徵,以及機器學習的輸出,進行視覺化的過程。
投影片連結
講者介紹
趙元 (Yuan CHAO)
從事高能物理研究的自由軟體愛好者
High energy physics researcher, OSS lover