Python 讓你的眼睛聽得見

Speaker

Yuchi Lin /Mandarin

Tags

speech recognition, lip recognition, pattern recogniton

Abstract

我所介紹的內容將著重於唇語的影像辨識上,我們從現實生活的經驗裡能得知,在嘈雜環境下只由聲音來與他人溝通是困難且模糊的,但若你能同時看著對方的唇形,將能大幅提昇對話的品質。為了實現這個目標,我採用 Python' OpenCV 來對影像做分析處理,從影像中擷取出代表性的特徵,進一步觀察連續的字元在轉換時是否具有相似的特徵點。未來將結合語音訊號,增強語音辨識的效能。

About Speaker


Profile picture
我就讀於台大工科海洋系資訊組碩士班,現階段研究的主題為模式識別(pattern recognition)。在接觸 Python 前我常用的語言是 C 及 MatLab,在踏入 Python 領域後才發現原來程式語言能如此得平易近人,尤其在參加過 Taipei.py 後更深刻的體會到 Python 的多樣性。很高興能成為 Python 愛好者的一員!

Organization/Company

National Taiwan University

Job title

Student