Analyzing Chinese Lyrics with Python

Language

Chinese talk w. Chinese slides

Category

Data Analysis

Python Level

Intermediate

Slides Link

https://speakerdeck.com/daikeren/analyzing-chinese-lyrics-with-python

Abstract

每個月有這麼多的中文新歌出現,哪些做詞的人詞彙比較豐富呢?使用怎麼樣的歌詞會比較容易紅呢?這個演講將會完成一個用 Python 分析歌詞的流程,並且找出一些有趣的現象跟大家分享。

Description

中文歌壇出現了許許多多如林夕、方文山等等以作詞聞名的詞人,現今的歌詞甚至可以直接放進國文課本當中。通常我們看到的分析都是文學性的分析,這個演講將會從自然語言處理的角度來看看歌詞。以下列出幾個我們想要瞭解的問題: * 哪些詞彙用的最多次 * 哪些詞人用的詞彙最豐富 * 用怎麼樣的詞彙的歌比較會紅 * 哪些人用的詞都很像 我們將透過自然語言處理方法、資料分析以及資料視覺化來幫助我們瞭解這些問題。 關鍵技術:Web Crawler, 自然語言處理, 分群, 資料視覺化

Andy Dai

我是 Taipei.py 的 organizer,平常會在社群當中出沒。目前在 GliaCloud 擔任 CTO。