Language
Chinese talk w. Chinese slides
Category
Data Analysis
Python Level
Intermediate
Slides Link
Abstract
每個月有這麼多的中文新歌出現,哪些做詞的人詞彙比較豐富呢?使用怎麼樣的歌詞會比較容易紅呢?這個演講將會完成一個用 Python 分析歌詞的流程,並且找出一些有趣的現象跟大家分享。
Description
中文歌壇出現了許許多多如林夕、方文山等等以作詞聞名的詞人,現今的歌詞甚至可以直接放進國文課本當中。通常我們看到的分析都是文學性的分析,這個演講將會從自然語言處理的角度來看看歌詞。以下列出幾個我們想要瞭解的問題:
* 哪些詞彙用的最多次
* 哪些詞人用的詞彙最豐富
* 用怎麼樣的詞彙的歌比較會紅
* 哪些人用的詞都很像
我們將透過自然語言處理方法、資料分析以及資料視覺化來幫助我們瞭解這些問題。
關鍵技術:Web Crawler, 自然語言處理, 分群, 資料視覺化
Andy Dai
我是 Taipei.py 的 organizer,平常會在社群當中出沒。目前在 GliaCloud 擔任 CTO。