需要金幣:![]() ![]() |
資料包括:完整論文 | ![]() |
![]() |
轉(zhuǎn)換比率:金額 X 10=金幣數(shù)量, 例100元=1000金幣 | 論文字?jǐn)?shù):8371 | ![]() | |
折扣與優(yōu)惠:團(tuán)購最低可5折優(yōu)惠 - 了解詳情 | 論文格式:Word格式(*.doc) | ![]() |
摘要:現(xiàn)如今,P2P網(wǎng)貸在中國迅速發(fā)展,其簡化的借貸過程存在著巨大的風(fēng)險(xiǎn)。本文基于融360網(wǎng)站提供的競賽數(shù)據(jù),首先對數(shù)據(jù)進(jìn)行合并、填補(bǔ)等預(yù)處理,其次通過特征工程構(gòu)建新的屬性,最后通過三種不同的單一分類模型和具有融合特征的分類模型分別對用戶是否發(fā)生逾期行為進(jìn)行預(yù)測。實(shí)驗(yàn)結(jié)果表明,三種單一分類模型中的邏輯回歸具有較好的預(yù)測效果,梯度提升決策樹相比于三種單一的分類模型具有更好的預(yù)測效果,特征工程在提升分類效果的過程中有著至關(guān)重要的作用。
關(guān)鍵詞:P2P網(wǎng)貸;決策樹;梯度提升決策樹;信用預(yù)測
目錄 摘要 Abstract 1 引 言-1 1.1 研究背景-1 1.2 研究意義-1 1.3 研究內(nèi)容-2 2 相關(guān)文獻(xiàn)綜述-2 2.1 信用風(fēng)險(xiǎn)研究-2 2.2 信用風(fēng)險(xiǎn)預(yù)測模型-3 2.2.1 決策樹-3 2.2.2 邏輯回歸-3 2.2.3 隨機(jī)森林-4 2.2.4 梯度提升決策樹-4 3 P2P網(wǎng)貸用戶信用數(shù)據(jù)描述與預(yù)處理-4 3.1 數(shù)據(jù)來源-4 3.2 數(shù)據(jù)描述-5 3.3 數(shù)據(jù)預(yù)處理-8 3.3.1 合并數(shù)據(jù)條目-8 3.3.2 構(gòu)建啞變量-8 3.3.3 合并不同類型的數(shù)據(jù)-9 4 P2P網(wǎng)貸用戶信用數(shù)據(jù)挖掘?qū)嶒?yàn)-9 4.1 特征工程-9 4.2 屬性重要性分析-9 4.3 數(shù)據(jù)挖掘?qū)嶒?yàn)-10 4.3.1 評價(jià)指標(biāo)AUC-10 4.3.2 決策樹、隨機(jī)森林和邏輯回歸-10 4.3.3 梯度提升決策樹-12 5 結(jié)論-13 參考文獻(xiàn)-15 致謝-17 |