Useful Tools to Explain ML Models

摘要

現今建立各種機器學習模型的套件很多,但是最常被詬病的是如何去解釋建立出來的機器學習模型。

尤其是若需要將模型應用到與人高度相關的行業中,如:金融業決定是否要發信用卡、醫療業協助診斷疾病等,若無法解釋模型,常會導致使用者或老闆不敢用、不相信模型之問題。

實際上現在已經有很多工具套件來協助解釋機器學習模型。
介紹三種常用的模型,以及如何運用套件來解釋這些模型。
包含線性迴歸可以用 p-value 和係數,Tree-based 模型可以用 feature importance 和 SHAP ,最後是類神經網路的模型一樣也可以用 SHAP 來對其做解釋。

主要會以結構化資料介紹 SHAP 套件的原理以及它的應用方式。

說明

SHAP的套件網址如下 https://github.com/slundberg/shap SHAP的使用範例也可以參考下面的網址 https://www.kaggle.com/dansbecker/shap-values

講者

Jack Pan

喜歡用Python開發的工程師。有三年以上的機器學習經驗,特別是將其運用到金融相關的問題上。