Python信用評(píng)分模型及模型優(yōu)化實(shí)戰(zhàn)
發(fā)布時(shí)間:2025-02-07 09:58:07
講師:傅一航 瀏覽次數(shù):7
課程描述INTRODUCTION
· 高層管理者· 中層領(lǐng)導(dǎo)· 新晉主管· 儲(chǔ)備干部
![](/Common/new/images/tb3_1.jpg)
![](/Common/new/images/tb3_2.jpg)
![](/Common/new/images/tb3_3.jpg)
日程安排SCHEDULE
課程大綱Syllabus
Python信用課程
【課程目標(biāo)】
本課程專注于金融行業(yè)的數(shù)據(jù)建模,包括客戶行為預(yù)測(cè)模型、風(fēng)控識(shí)別與風(fēng)控預(yù)測(cè)模型、信用評(píng)分模型等,面向數(shù)據(jù)分析部等專門(mén)負(fù)責(zé)數(shù)據(jù)分析與建模的人士。
本課程的主要目的是,培養(yǎng)學(xué)員的大數(shù)據(jù)意識(shí)和大數(shù)據(jù)思維,掌握常用的數(shù)據(jù)分析方法和數(shù)據(jù)分析模型,并能夠用于對(duì)客戶行為作分析和預(yù)測(cè),提升學(xué)員的數(shù)據(jù)分析綜合能力。
通過(guò)本課程的學(xué)習(xí),達(dá)到如下目的:
1、 掌握數(shù)據(jù)分析和數(shù)據(jù)建模的基本過(guò)程和步驟
2、 掌握數(shù)據(jù)分析框架的搭建,及常用分析方法
3、 掌握業(yè)務(wù)的影響因素分析常用的方法
4、 掌握常用客戶行為預(yù)測(cè)模型,包括邏輯回歸、決策樹(shù)、神經(jīng)網(wǎng)絡(luò)等等
5、 掌握模型優(yōu)化的思路及措施,包括特征優(yōu)化、超參優(yōu)化、集成優(yōu)化等
6、 掌握金融行業(yè)信用評(píng)分卡模型,構(gòu)建信用評(píng)分模型
本課程突出數(shù)據(jù)挖掘的實(shí)際應(yīng)用,結(jié)合行業(yè)的典型應(yīng)用特點(diǎn),從實(shí)際問(wèn)題入手,引出相關(guān)知識(shí),進(jìn)行大數(shù)據(jù)的收集與處理;探索數(shù)據(jù)之間的規(guī)律及關(guān)聯(lián)性,幫助學(xué)員掌握系統(tǒng)的數(shù)據(jù)預(yù)處理方法;介紹常用的模型,訓(xùn)練模型,并優(yōu)化模型,以達(dá)到最優(yōu)分析結(jié)果。
【授課對(duì)象】
風(fēng)險(xiǎn)控制部、金融科技部、IT系統(tǒng)部、數(shù)據(jù)分析部等對(duì)數(shù)據(jù)建模有較高要求的相關(guān)領(lǐng)域人員。
【課程大綱】
第一部分: 數(shù)據(jù)分析基礎(chǔ)
目的:掌握數(shù)據(jù)分析基本步驟和過(guò)程,學(xué)會(huì)如何構(gòu)造數(shù)據(jù)分析框架
1、 數(shù)據(jù)決策的三個(gè)關(guān)鍵環(huán)節(jié)
業(yè)務(wù)數(shù)據(jù)化:將業(yè)務(wù)問(wèn)題轉(zhuǎn)化為數(shù)據(jù)問(wèn)題
數(shù)據(jù)信息化:提取數(shù)據(jù)中的業(yè)務(wù)規(guī)律信息
信息策略化:基于規(guī)律形成業(yè)務(wù)應(yīng)對(duì)策略
2、 數(shù)據(jù)分析的六步曲
步驟1:明確目的--理清思路
步驟2:數(shù)據(jù)收集—理清思路
步驟3:數(shù)據(jù)預(yù)處理—尋找答案
步驟4:數(shù)據(jù)分析--尋找答案
步驟5:數(shù)據(jù)展示--觀點(diǎn)表達(dá)
步驟6:報(bào)表撰寫(xiě)--觀點(diǎn)表達(dá)
第二部分: 搭建業(yè)務(wù)分析框架
1、 數(shù)據(jù)分析思路來(lái)源于業(yè)務(wù)模型
2、 分析框架來(lái)源于業(yè)務(wù)模型
商業(yè)目標(biāo)(粗粒度)
分析維度/關(guān)鍵步驟
業(yè)務(wù)問(wèn)題(細(xì)粒度)
涉及數(shù)據(jù)/關(guān)鍵指標(biāo)
案例:搭建精準(zhǔn)營(yíng)銷的分析框架(6R)
如何尋找目標(biāo)客戶群
如何匹配合適的產(chǎn)品
如何確定推薦的*時(shí)機(jī)
如何判斷合理的價(jià)格
案例:搭建用戶購(gòu)買(mǎi)行為分析框架(5W2H)
3、 信用評(píng)估需要采集的數(shù)據(jù)
身份信息、認(rèn)證數(shù)據(jù)、
消費(fèi)數(shù)據(jù)、行為數(shù)據(jù)、
社交數(shù)據(jù)、設(shè)備數(shù)據(jù)、
金融數(shù)據(jù)、
第三部分: 數(shù)據(jù)建模步驟
1、 預(yù)測(cè)建模六步法
2、 選擇模型
基于業(yè)務(wù)選擇恰當(dāng)?shù)臄?shù)據(jù)模型
常見(jiàn)模型簡(jiǎn)介
3、 特征工程
選擇對(duì)目標(biāo)變量有顯著影響的屬性來(lái)建模
降維的兩種方式:特征選擇、因子合并
4、 訓(xùn)練模型
采用合適的算法對(duì)模型進(jìn)行訓(xùn)練,尋找到最優(yōu)參數(shù)
常用模型原理
5、 評(píng)估模型
進(jìn)行評(píng)估模型的質(zhì)量,判斷模型是否可用
評(píng)估指標(biāo)、評(píng)估方法
6、 優(yōu)化模型
如果評(píng)估結(jié)果不理想,則需要對(duì)模型進(jìn)行優(yōu)化
7、 應(yīng)用模型
如果評(píng)估結(jié)果滿足要求,則可應(yīng)用模型于業(yè)務(wù)場(chǎng)景
第四部分: 銀行客戶信用卡模型
1、 信用評(píng)分卡模型簡(jiǎn)介
2、 評(píng)分卡的關(guān)鍵問(wèn)題
3、 信用評(píng)分卡建立過(guò)程
篩選重要屬性
數(shù)據(jù)集轉(zhuǎn)化
建立分類模型
計(jì)算屬性分值
確定審批閾值
4、 篩選重要屬性
屬性分段
基本概念:WOE、IV
屬性重要性評(píng)估
5、 數(shù)據(jù)集轉(zhuǎn)化
連續(xù)屬性最優(yōu)分段
計(jì)算屬性取值的WOE
6、 建立分類模型
訓(xùn)練邏輯回歸模型
評(píng)估模型
得到字段系數(shù)
7、 計(jì)算屬性分值
計(jì)算補(bǔ)償與刻度值
計(jì)算各字段得分
生成評(píng)分卡
8、 確定審批閾值
畫(huà)K-S曲線
計(jì)算K-S值
獲取最優(yōu)閾值
案例:構(gòu)建銀行小額貸款的用戶信用模型
9、 信用評(píng)分卡的優(yōu)化方向
改變屬性重要性評(píng)估方法
采用其他更精準(zhǔn)的模型,如決策樹(shù)、神經(jīng)網(wǎng)絡(luò)、集成模型等
第五部分: 其他分類預(yù)測(cè)模型
問(wèn)題:如何評(píng)估客戶購(gòu)買(mǎi)產(chǎn)品的可能性?如何預(yù)測(cè)客戶的購(gòu)買(mǎi)行為?如何提取某類客戶的典型特征?如何向客戶精準(zhǔn)推薦產(chǎn)品或業(yè)務(wù)?
1、 分類模型概述及其應(yīng)用場(chǎng)景
2、 常見(jiàn)分類預(yù)測(cè)模型
3、 邏輯回歸(LR)
邏輯回歸的適用場(chǎng)景
邏輯回歸的模型原理
邏輯回歸分類的幾何意義
邏輯回歸的種類:二項(xiàng)、多項(xiàng)
如何解讀邏輯回歸方程
邏輯回歸算法的實(shí)現(xiàn)及優(yōu)化
迭代樣本的隨機(jī)選擇
變化的學(xué)習(xí)率
邏輯回歸+正則項(xiàng)
求解算法與懲罰項(xiàng)的互斥有關(guān)系
帶分類自變量的邏輯回歸分析
多項(xiàng)邏輯回歸/多分類邏輯回歸
ovo, ovr
案例:用sklearn庫(kù)實(shí)現(xiàn)銀行貸款違約預(yù)測(cè)
案例:訂閱者用戶的典型特征(二元邏輯回歸)
案例:通信套餐的用戶畫(huà)像(多元邏輯回歸)
4、 分類決策樹(shù)(DT)
問(wèn)題:如何預(yù)測(cè)客戶行為?如何識(shí)別潛在客戶?
風(fēng)控:如何識(shí)別欠貸者的特征,以及預(yù)測(cè)欠貸概率?
客戶保有:如何識(shí)別流失客戶特征,以及預(yù)測(cè)客戶流失概率?
決策樹(shù)分類簡(jiǎn)介
演練:識(shí)別銀行欠貨風(fēng)險(xiǎn),提取欠貸者的特征
決策樹(shù)分類的幾何意義
決策樹(shù)算法(三個(gè)關(guān)鍵問(wèn)題)
如何選擇*屬性來(lái)構(gòu)建節(jié)點(diǎn):熵/基尼系數(shù)、信息增益
如何分裂變量:多元/二元?jiǎng)澐帧⒆顑?yōu)切割點(diǎn)
修剪決策樹(shù):剪枝原則、預(yù)剪枝與后剪枝
決策樹(shù)的解讀
決策樹(shù)的超參優(yōu)化
案例:商場(chǎng)用戶的典型特征提取
案例:客戶流失預(yù)警與客戶挽留
案例:識(shí)別拖欠銀行貨款者的特征,避免不良貨款
多分類決策樹(shù)
案例:識(shí)別不同理財(cái)客戶的典型特征,實(shí)現(xiàn)精準(zhǔn)推薦
5、 人工神經(jīng)網(wǎng)絡(luò)(ANN)
神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
神經(jīng)網(wǎng)絡(luò)基本原理
加法器,激活函數(shù)
神經(jīng)網(wǎng)絡(luò)分類的幾何意義
神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
隱藏層數(shù)量
神經(jīng)元個(gè)數(shù)
神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)算法
案例:評(píng)估銀行用戶拖欠貨款的概率
第六部分: 模型超參優(yōu)化
1、 模型優(yōu)化的三大方向
超參優(yōu)化
特征工程
集成優(yōu)化
2、 超參優(yōu)化的方法比較
交叉驗(yàn)證類(RidgeCV/LassoCV/LogisticRegressionCV/…)
網(wǎng)格搜索GridSearchCV
隨機(jī)搜索RandomizedSearchCV
貝葉斯搜索BayesSearchCV
3、 超參調(diào)優(yōu)策略
第七部分: 特征工程優(yōu)化
1、 數(shù)據(jù)清洗技巧
異常數(shù)據(jù)的處理方式
缺失值的填充方式
不同填充方式對(duì)模型效果的影響
2、 降維的兩大方式:特征選擇和因子合并
3、 特征選擇的模式
基于變量本身的重要性篩選
Filter式(特征選擇與模型分離)
Wrapper式(利用模型結(jié)果進(jìn)行特征選擇)
embedded式(模型自帶特征重要性評(píng)估)
確定特征選擇的變量個(gè)數(shù)
案例:客戶流失預(yù)測(cè)的特征選擇
4、 因子合并(將多數(shù)變量合并成少數(shù)幾個(gè)因子)
因子分析(FactorAnalysis):原理、適用場(chǎng)景、載荷矩陣
主成份分析PCA:原理、幾何含義、擴(kuò)展KernelCA/ICA/…
案例:汽車(chē)油效預(yù)測(cè)
5、 變量變換
為何需要變量變換
因變量變換對(duì)模型質(zhì)量的影響
特征標(biāo)準(zhǔn)化:作用、不同模型對(duì)標(biāo)準(zhǔn)化的要求、不同標(biāo)準(zhǔn)化對(duì)模型的影響
其它變換:正態(tài)化、正則化等
6、 變量派生:基于業(yè)務(wù)經(jīng)驗(yàn)的派生、多項(xiàng)式派生
7、 特征工程的管道實(shí)現(xiàn)
管道類Pipeline
列轉(zhuǎn)換類ColumnTransformer
特征合并類FeatureUnion
第八部分: 集成算法優(yōu)化
1、 模型的優(yōu)化思路
2、 集成算法基本原理
單獨(dú)構(gòu)建多個(gè)弱分類器
多個(gè)弱分類器組合投票,決定預(yù)測(cè)結(jié)果
3、 集成方法的種類:Bagging、Boosting、Stacking
4、 Bagging集成:隨機(jī)森林RF
數(shù)據(jù)/屬性重抽樣
決策依據(jù):少數(shù)服從多數(shù)
5、 Boosting集成:AdaBoost模型
基于誤分?jǐn)?shù)據(jù)建模
樣本選擇權(quán)重更新公式
決策依據(jù):加權(quán)投票
6、 高級(jí)模型介紹與實(shí)現(xiàn)
GBDT梯度提升決策樹(shù)
XGBoost
LightGBM
結(jié)束:課程總結(jié)與問(wèn)題答疑。
Python信用課程
轉(zhuǎn)載:http://xvaqeci.cn/gkk_detail/317089.html
已開(kāi)課時(shí)間Have start time
- 傅一航
[僅限會(huì)員]
IT相關(guān)內(nèi)訓(xùn)
- 網(wǎng)安管理崗培訓(xùn) 張勝生
- 信息安全風(fēng)險(xiǎn)評(píng)估與加固技能 張勝生
- Python數(shù)據(jù)建模及模型 傅一航
- Fine BI 數(shù)據(jù)分析與 張曉如
- Python信用評(píng)分模型及 傅一航
- Python高效辦公自動(dòng)化 張曉如
- CISSP認(rèn)證培訓(xùn)課程 張勝生
- Python數(shù)據(jù)建模與模型 傅一航
- 滲透測(cè)試與攻防實(shí)戰(zhàn)高級(jí)課程 張勝生
- 電力信息化:價(jià)值和建設(shè)分析 劉宇佳
- IT崗位數(shù)智化能力提升路徑 甄文智
- 軟件安全意識(shí)加強(qiáng)與技能提高 張勝生