欧美亚洲超清无码专区,亚洲成本人片无码免费,风流少妇BBWBBW69视频,成人亚洲A片V丝袜专区

全國 [城市選擇] [會員登錄] [講師注冊] [機構注冊] [助教注冊]  
中國企業(yè)培訓講師
Python數(shù)據(jù)建模及模型優(yōu)化實戰(zhàn)(金融版)
發(fā)布時間:2025-02-07 10:00:59
 
講師:傅一航 瀏覽次數(shù):8

課程描述INTRODUCTION

· 總經理· 高層管理者· 中層領導

培訓講師:傅一航    課程價格:¥元/人    培訓天數(shù):3天   

日程安排SCHEDULE



課程大綱Syllabus

Python數(shù)據(jù)建模課程
 
【課程目標】
本課程專注于金融行業(yè)的數(shù)據(jù)建模,包括客戶行為預測模型,風控識別與風控預測模型,面向數(shù)據(jù)分析部等專門負責數(shù)據(jù)分析與建模的人士。
本課程的主要目的是,培養(yǎng)學員的大數(shù)據(jù)意識和大數(shù)據(jù)思維,掌握常用的數(shù)據(jù)分析方法和數(shù)據(jù)分析模型,并能夠用于對客戶行為作分析和預測,提升學員的數(shù)據(jù)分析綜合能力。
通過本課程的學習,達到如下目的:
1、 掌握數(shù)據(jù)分析和數(shù)據(jù)建模的基本過程和步驟
2、 掌握數(shù)據(jù)分析框架的搭建,及常用分析方法
3、 掌握業(yè)務的影響因素分析常用的方法
4、 掌握常用客戶行為預測模型,包括邏輯回歸、決策樹、神經網(wǎng)絡等等
5、 掌握模型優(yōu)化的思路及措施,包括特征優(yōu)化、超參優(yōu)化、集成優(yōu)化等
6、 掌握金融行業(yè)信用評分卡模型,構建信用評分模型
本課程突出數(shù)據(jù)挖掘的實際應用,結合行業(yè)的典型應用特點,從實際問題入手,引出相關知識,進行大數(shù)據(jù)的收集與處理;探索數(shù)據(jù)之間的規(guī)律及關聯(lián)性,幫助學員掌握系統(tǒng)的數(shù)據(jù)預處理方法;介紹常用的模型,訓練模型,并優(yōu)化模型,以達到最優(yōu)分析結果。
 
【授課對象】
風險控制部、金融科技部、IT系統(tǒng)部、數(shù)據(jù)分析部等對數(shù)據(jù)建模有較高要求的相關領域人員。
 
【課程大綱】
第一部分: 數(shù)據(jù)分析基礎—流程步驟篇
目的:掌握數(shù)據(jù)分析基本步驟和過程,學會如何構造數(shù)據(jù)分析框架
1、 數(shù)據(jù)決策的三個關鍵環(huán)節(jié)
業(yè)務數(shù)據(jù)化:將業(yè)務問題轉化為數(shù)據(jù)問題
數(shù)據(jù)信息化:提取數(shù)據(jù)中的業(yè)務規(guī)律信息
信息策略化:基于規(guī)律形成業(yè)務應對策略
2、 數(shù)據(jù)分析的六步曲
步驟1:明確目的--理清思路
步驟2:數(shù)據(jù)收集—理清思路
步驟3:數(shù)據(jù)預處理—尋找答案
步驟4:數(shù)據(jù)分析--尋找答案
步驟5:數(shù)據(jù)展示--觀點表達
步驟6:報表撰寫--觀點表達
 
第二部分: 數(shù)據(jù)分析框架—業(yè)務模型篇
1、 數(shù)據(jù)分析思路來源于業(yè)務模型
2、 分析框架來源于業(yè)務模型
商業(yè)目標(粗粒度)
分析維度/關鍵步驟
業(yè)務問題(細粒度)
涉及數(shù)據(jù)/關鍵指標
3、 常用的業(yè)務模型:PEST/5W2H/SWOT/PDCA/AARRR…
案例:搭建精準營銷的分析框架(6R)
如何尋找目標客戶群
如何匹配合適的產品
如何確定推薦的*時機
如何判斷合理的價格
案例:搭建用戶購買行為分析框架(5W2H)
 
第三部分: 探索性分析法—統(tǒng)計分析篇
問題:數(shù)據(jù)分析方法的種類?分析方法的不同應用場景?
1、 業(yè)務分析的三個階段
現(xiàn)狀分析:通過企業(yè)運營指標來發(fā)現(xiàn)規(guī)律及短板
原因分析:查找數(shù)據(jù)相關性,探尋目標影響因素
預測分析:合理配置資源,預判業(yè)務未來的趨勢
2、 常用的數(shù)據(jù)分析方法五大種類
3、 統(tǒng)計分析基礎(類別à指標)
4、 描述性分析法(現(xiàn)狀分析)
對比分析(查看數(shù)據(jù)差距,發(fā)現(xiàn)事物變化)
演練:分析理財產品受歡迎情況及貢獻大小
演練:用戶消費水平差異分析,提取優(yōu)質客戶特征
分布分析(查看數(shù)據(jù)分布,探索業(yè)務層次)
案例:銀行用戶的消費層次/消費檔次分析
演練:客戶年齡分布/收入分布分析
結構分析(查看指標構成,評估結構合理性)
案例:收入結構分析/成本結構分析
案例:動態(tài)結構分析
趨勢分析(查看變化趨勢,了解季節(jié)周期性)
案例:營業(yè)廳客流量規(guī)律與排班
案例:用戶活躍時間規(guī)律/產品銷量的淡旺季分析
演練:產品訂單的季節(jié)周期性規(guī)律
5、 相關性分析(原因分析)
相關分析(衡量兩變量間的相關程度,三種相關系數(shù))
方差分析(判斷影響目標變量的關鍵要素,適用場景)
卡方檢驗(從多個維度的數(shù)據(jù)指標分析)
演練:不同客戶的產品偏好分析
演練:銀行用戶違約的影響因素分析
 
第四部分: 用戶風險識別—異常數(shù)據(jù)篇
1、 反欺詐識別的重點內容
如何識別異常數(shù)據(jù)
如何查找影響因素
如何提取欺詐用戶的特征
如何預測用戶的欺詐行為
2、 異常數(shù)據(jù)的定義
3、 異常數(shù)據(jù)的檢測方法
基于統(tǒng)計法:標準差法、四分位距法、離群點檢測算法
基于機器學習:回歸、聚類等
4、 異常數(shù)據(jù)處理方法
演練:各種異常數(shù)據(jù)識別
 
第五部分: 影響因素分析—根因分析篇
問題:如何做原因分析?比如價格是否可用于產品銷量?影響用戶違約的關鍵因素是什么?
1、 數(shù)據(jù)預處理vs特征工程
2、 常用特征選擇方法
相關分析、方差分析、卡方檢驗
3、 相關分析(衡量兩數(shù)據(jù)型變量的線性相關性)
相關分析簡介
相關分析的應用場景
相關分析的種類
簡單相關分析
偏相關分析
距離相關分析
相關系數(shù)的三種計算公式
Pearson相關系數(shù)
Spearman相關系數(shù)
Kendall相關系數(shù)
相關分析的假設檢驗
相關分析的四個基本步驟
演練:營銷費用會影響銷售額嗎?影響程度如何量化?
演練:哪些因素與產品銷量有顯著的相關性
演練:影響用戶消費水平的因素會有哪些
偏相關分析
偏相關原理:排除不可控因素后的兩變量的相關性
偏相關系數(shù)的計算公式
偏相關分析的適用場景
4、 方差分析(衡量類別變量與數(shù)值變量間的相關性)
方差分析的應用場景
方差分析的三個種類
單因素方差分析
多因素方差分析
協(xié)方差分析
單因素方差分析的原理
方差分析的四個步驟
解讀方差分析結果的兩個要點
案例:擺放位置與銷量有關嗎
演練:客戶學歷對消費水平的影響分析
多因素方差分析原理
多因素方差分析的作用
多因素方差結果的解讀
案例:廣告形式、地區(qū)對銷售額的影響因素分析
演練:銷售員的性別、技能級別對銷量有影響嗎
協(xié)方差分析原理
協(xié)方差分析的適用場景
演練:排除用戶收入,其余哪些因素對銷量有顯著影響?
5、 列聯(lián)分析/卡方檢驗(兩類別變量的相關性分析)
交叉表與列聯(lián)表:計數(shù)值與期望值
卡方檢驗的原理
卡方檢驗的幾個計算公式
列聯(lián)表分析的適用場景
案例:產品類型對客戶流失的影響分析
案例:用戶學歷對產品類型偏好的影響分析
研討:行業(yè)/規(guī)模對風控的影響分析
 
第六部分: 數(shù)據(jù)建模過程—建模步驟篇
1、 預測建模六步法
選擇模型:基于業(yè)務選擇恰當?shù)臄?shù)據(jù)模型
特征工程:選擇對目標變量有顯著影響的屬性來建模
訓練模型:采用合適的算法對模型進行訓練,尋找到最優(yōu)參數(shù)
評估模型:進行評估模型的質量,判斷模型是否可用
優(yōu)化模型:如果評估結果不理想,則需要對模型進行優(yōu)化
應用模型:如果評估結果滿足要求,則可應用模型于業(yè)務場景
2、 數(shù)據(jù)挖掘常用的模型
定量預測模型:回歸預測、時序預測等
定性預測模型:邏輯回歸、決策樹、神經網(wǎng)絡、支持向量機等
市場細分:聚類、RFM、PCA等
產品推薦:關聯(lián)分析、協(xié)同過濾等
產品優(yōu)化:回歸、隨機效用等
產品定價:定價策略/最優(yōu)定價等
3、 特征工程/特征選擇/變量降維
基于變量本身特征
基于相關性判斷
因子合并(PCA等)
IV值篩選(評分卡使用)
基于信息增益判斷(決策樹使用)
4、 模型評估
模型質量評估指標:R^2、正確率/查全率/查準率/特異性等
預測值評估指標:MAD、MSE/RMSE、MAPE、概率等
模型評估方法:留出法、K拆交叉驗證、自助法等
其它評估:過擬合評估、殘差檢驗
5、 模型優(yōu)化
優(yōu)化模型:選擇新模型/修改模型
優(yōu)化數(shù)據(jù):新增顯著自變量
優(yōu)化公式:采用新的計算公式
集成思想:Bagging/Boosting/Stacking
6、 常用預測模型介紹:回歸、時序、分類
 
第七部分: 客戶行為預測—分類模型篇
問題:如何評估客戶購買產品的可能性?如何預測客戶的購買行為?如何提取某類客戶的典型特征?如何向客戶精準推薦產品或業(yè)務?
1、 分類模型概述及其應用場景
2、 常見分類預測模型
3、 邏輯回歸(LR)
邏輯回歸的適用場景
邏輯回歸的模型原理
邏輯回歸分類的幾何意義
邏輯回歸的種類:二項、多項
如何解讀邏輯回歸方程
邏輯回歸算法的實現(xiàn)及優(yōu)化
迭代樣本的隨機選擇
變化的學習率
邏輯回歸+正則項
求解算法與懲罰項的互斥有關系
帶分類自變量的邏輯回歸分析
多項邏輯回歸/多分類邏輯回歸
ovo, ovr
案例:用sklearn庫實現(xiàn)銀行貸款違約預測
案例:訂閱者用戶的典型特征(二元邏輯回歸)
案例:通信套餐的用戶畫像(多元邏輯回歸)
4、 分類決策樹(DT)
問題:如何預測客戶行為?如何識別潛在客戶?
風控:如何識別欠貸者的特征,以及預測欠貸概率?
客戶保有:如何識別流失客戶特征,以及預測客戶流失概率?
決策樹分類簡介
演練:識別銀行欠貨風險,提取欠貸者的特征
決策樹分類的幾何意義
決策樹算法(三個關鍵問題)
如何選擇*屬性來構建節(jié)點:熵/基尼系數(shù)、信息增益
如何分裂變量:多元/二元劃分、最優(yōu)切割點
修剪決策樹:剪枝原則、預剪枝與后剪枝
決策樹的解讀
決策樹的超參優(yōu)化
案例:商場用戶的典型特征提取
案例:客戶流失預警與客戶挽留
案例:識別拖欠銀行貨款者的特征,避免不良貨款
多分類決策樹
案例:識別不同理財客戶的典型特征,實現(xiàn)精準推薦
5、 人工神經網(wǎng)絡(ANN)
神經網(wǎng)絡的結構
神經網(wǎng)絡基本原理
加法器,激活函數(shù)
神經網(wǎng)絡分類的幾何意義
神經網(wǎng)絡的結構
隱藏層數(shù)量
神經元個數(shù)
神經網(wǎng)絡實現(xiàn)算法
案例:評估銀行用戶拖欠貨款的概率
6、 支持向量機(SVM)
SVM基本原理
線性可分問題:*邊界超平面
線性不可分問題:特征空間的轉換
維災難與核函數(shù)
 
第八部分: 客戶行為預測—模型評估篇
1、 三個方面評估:指標、方法、過擬合
2、 兩大矩陣
混淆矩陣
代價矩陣
3、 六大指標
正確率Accuracy
查準率Precision
查全率Recall
特異度Specify
F度量值(/)
提升指標lift
4、 三條曲線
ROC曲線和AUC
PR曲線和BEP
KS曲線和KS值
5、 多分類模型評估指標
宏指標:macro_P, macro_R
宏指標:micro_P, micro_R
6、 模型評估方法
原始評估法
留出法(Hold-Out)
交叉驗證法(k-fold cross validation)
自助采樣法(Bootstrapping)
7、 其它評估
過擬合評估:學習曲線
模型差異性評估
殘差評估:白噪聲評估
 
第九部分: 預測模型優(yōu)化—超參優(yōu)化篇
1、 模型優(yōu)化的三大方向
超參優(yōu)化
特征工程
集成優(yōu)化
2、 超參優(yōu)化的方法比較
交叉驗證類(RidgeCV/LassoCV/LogisticRegressionCV/…)
網(wǎng)格搜索GridSearchCV
隨機搜索RandomizedSearchCV
貝葉斯搜索BayesSearchCV
3、 超參調優(yōu)策略
 
第十部分: 預測模型優(yōu)化—特征工程篇
1、 數(shù)據(jù)清洗技巧
異常數(shù)據(jù)的處理方式
缺失值的填充方式
不同填充方式對模型效果的影響
2、 降維的兩大方式:特征選擇和因子合并
3、 特征選擇的模式
基于變量本身的重要性篩選
Filter式(特征選擇與模型分離)
Wrapper式(利用模型結果進行特征選擇)
embedded式(模型自帶特征重要性評估)
確定特征選擇的變量個數(shù)
案例:客戶流失預測的特征選擇
4、 因子合并(將多數(shù)變量合并成少數(shù)幾個因子)
因子分析(FactorAnalysis):原理、適用場景、載荷矩陣
主成份分析PCA:原理、幾何含義、擴展KernelCA/ICA/…
案例:汽車油效預測
5、 變量變換
為何需要變量變換
因變量變換對模型質量的影響
特征標準化:作用、不同模型對標準化的要求、不同標準化對模型的影響
其它變換:正態(tài)化、正則化等
6、 變量派生:基于業(yè)務經驗的派生、多項式派生
7、 特征工程的管道實現(xiàn)
管道類Pipeline
列轉換類ColumnTransformer
特征合并類FeatureUnion
 
第十一部分: 預測模型優(yōu)化—集成優(yōu)化篇
1、 模型的優(yōu)化思路
2、 集成算法基本原理
單獨構建多個弱分類器
多個弱分類器組合投票,決定預測結果
3、 集成方法的種類:Bagging、Boosting、Stacking
4、 Bagging集成:隨機森林RF
數(shù)據(jù)/屬性重抽樣
決策依據(jù):少數(shù)服從多數(shù)
5、 Boosting集成:AdaBoost模型
基于誤分數(shù)據(jù)建模
樣本選擇權重更新公式
決策依據(jù):加權投票
6、 高級模型介紹與實現(xiàn)
GBDT梯度提升決策樹
XGBoost
LightGBM
 
第十二部分: XGBoost模型詳解及優(yōu)化
1、 基本參數(shù)配置
框架基本參數(shù): n_estimators, objective
性能相關參數(shù): learning_rate
模型復雜度參數(shù):max_depth,min_child_weight,gamma
生長策略參數(shù): grow_policy, tree_method, max_bin
隨機性參數(shù):subsample,colsample_bytree
正則項參數(shù):reg_alpha,reg_lambda
樣本不均衡參數(shù): scale_pos_weight
2、 早期停止與基類個數(shù)優(yōu)化(n_estimators、early_stopping_rounds)
3、 樣本不平衡處理
欠抽樣與過抽樣
scale_pos_weight= neg_num/pos_num
4、 XGBoost模型欠擬合優(yōu)化措施
增維,派生新特征
非線性檢驗
相互作用檢驗
降噪,剔除噪聲數(shù)據(jù)
剔除不顯著影響因素
剔除預測離群值(僅回歸)
多重共線性檢驗(僅回歸)
變量變換
自變量標準化
殘差項檢驗與因變量變換
增加樹的深度與復雜度
增大max_depth
減小min_child_weight, gamma等
禁止正則項生效
5、 特征重要性評估與自動特征選擇
6、 超參優(yōu)化策略:
分組調參:參數(shù)分組分別調優(yōu)
分層調參:先粗調再細調
7、 XGBoost模型過擬合優(yōu)化措施
降維,減少特征數(shù)量
限制樹的深度和復雜度
減小max_depth
增大min_child_weight,gamma等
采用dart模型來控制過擬合(引入dropout技術)
啟用正則項懲罰:reg_alpha,reg_lambda等
啟用隨機采樣:subsample,colsample_bytree等
8、 Stacking模式:XGBoost+LR、XGBoost+RF等
9、 XGBoost的優(yōu)化模型:LightGBM
 
第十三部分: 銀行客戶信用卡模型
1、 信用評分卡模型簡介
2、 評分卡的關鍵問題
3、 信用評分卡建立過程
篩選重要屬性
數(shù)據(jù)集轉化
建立分類模型
計算屬性分值
確定審批閾值
4、 篩選重要屬性
屬性分段
基本概念:WOE、IV
屬性重要性評估
5、 數(shù)據(jù)集轉化
連續(xù)屬性最優(yōu)分段
計算屬性取值的WOE
6、 建立分類模型
訓練邏輯回歸模型
評估模型
得到字段系數(shù)
7、 計算屬性分值
計算補償與刻度值
計算各字段得分
生成評分卡
8、 確定審批閾值
畫K-S曲線
計算K-S值
獲取最優(yōu)閾值
案例:構建銀行小額貸款的用戶信用模型
 
第十四部分: 數(shù)據(jù)建模實戰(zhàn)篇
1、 電信業(yè)客戶流失預警和客戶挽留模型實戰(zhàn)
2、 銀行欠貸風險預測模型實戰(zhàn)
3、 銀行信用卡評分模型實戰(zhàn)
 
結束:課程總結與問題答疑。
 
Python數(shù)據(jù)建模課程

轉載:http://xvaqeci.cn/gkk_detail/317090.html

已開課時間Have start time

在線報名Online registration

    參加課程:Python數(shù)據(jù)建模及模型優(yōu)化實戰(zhàn)(金融版)

    單位名稱:

  • 參加日期:
  • 聯(lián)系人:
  • 手機號碼:
  • 座機電話:
  • QQ或微信:
  • 參加人數(shù):
  • 開票信息:
  • 輸入驗證:  看不清楚?點擊驗證碼刷新
付款信息:
開戶名:上海投智企業(yè)管理咨詢有限公司
開戶行:中國銀行股份有限公司上海市長壽支行
帳號:454 665 731 584
傅一航
[僅限會員]