輿論分析量測電視劇觀看喜好的風向 Public opinion monitoring for TV series

摘要

在 KKTV 分析數據時,深刻體會僅透過自家用戶觀影紀錄無法全盤瞭解市場反應。我們嘗試進行輿論監測(Public Opinion Monitoring),例如蒐集 PTT 戲劇看板文章,透過自然語言處理(Natural Language Processing)的相關方法,如斷詞(word Segmentation)、移除停止詞(stop words removal)、命名實體識別(Named Entity Recognition)等,智慧化偵測每篇文章所討論的劇名,再由各式量化分析,給予每部戲劇不同的指標幫助我們瞭解劇迷的反應以及總體傾向,補足內部資料的不足。

說明

由於透過自家用戶觀影紀錄無法全盤瞭解市場反應,我們嘗試透過輿論偵測,試著更了解劇迷的反應與整體傾向,流程上大致為: 1. 蒐集討論文章: 蒐集相關的討論文章,先有資料才能做分析,不然一切都是空談。 2. 擷取文章主題: 智慧判讀每篇文章是在討論哪部劇,知道每部劇分別有哪些討論,才能加以分析。 3. 量化分析數據: 瞭解每篇文章的討論主題後,依照劇名做量化分析、時序分析等。

Slides

https://drive.google.com/open?id=1C2mN2JIuCEFrncHsXQGP6MKweS-R2Oms

講者

魏聖倫 Kevin Wei

2014 年於台大自然語言處理實驗室與學長組隊參與 ACM SIGIR 2014 Entity Recognition and Disambiguation Challenge 取得 First Prize 後(詳見 http://homepage.ntu.edu.tw/~ntunewsletter/2014_no43-05.html),便一頭栽入自然語言處理的世界。碩士求學期間,致力於中文自然語言處理,釋出開源資料 NTU NL2KB Resource,為該領域貢獻心力。

現任 KKStream 資料分析團隊一員。同時也是 Python 語言愛好推廣者,畢業至今已連續四期在台大舉辦「ccClub Python 讀書會」,擔任主講者,參與學員迄今總計四百餘位。
- 2016秋 台大創意創業學程及台大車庫合辦
- 2017春 台大國企系學會合辦 https://goo.gl/FwBqY1
- 2017秋 台大經濟統計資料研究中心合辦 https://goo.gl/rAo3GC
- 2018春 台大經濟統計資料研究中心合辦 https://goo.gl/n519PD