设计 任务书 文档 开题 答辩 说明书 格式 模板 外文 翻译 范文 资料 作品 文献 课程 实习 指导 调研 下载 网络教育 计算机 网站 网页 小程序 商城 购物 订餐 电影 安卓 Android Html Html5 SSM SSH Python 爬虫 大数据 管理系统 图书 校园网 考试 选题 网络安全 推荐系统 机械 模具 夹具 自动化 数控 车床 汽车 故障 诊断 电机 建模 机械手 去壳机 千斤顶 变速器 减速器 图纸 电气 变电站 电子 Stm32 单片机 物联网 监控 密码锁 Plc 组态 控制 智能 Matlab 土木 建筑 结构 框架 教学楼 住宅楼 造价 施工 办公楼 给水 排水 桥梁 刚构桥 水利 重力坝 水库 采矿 环境 化工 固废 工厂 视觉传达 室内设计 产品设计 电子商务 物流 盈利 案例 分析 评估 报告 营销 报销 会计
 首 页 机械毕业设计 电子电气毕业设计 计算机毕业设计 土木工程毕业设计 视觉传达毕业设计 理工论文 文科论文 毕设资料 帮助中心 设计流程 
垫片
您现在所在的位置:首页 >>毕设资料 >> 文章内容
                 
垫片
   我们提供全套毕业设计和毕业论文服务,联系微信号:biyezuopin QQ:2922748026   
基于Python的信用卡交易欺诈检测预测模型 任务书
文章来源:www.biyezuopin.vip   发布者:毕业作品网站  

背景

交易欺诈作为信用卡行业面临的主要贷后风险业务问题,每年都使信用卡行业遭受巨额损失。基于大数据机器学习开发出高效的交易欺诈识别模型一直是金融行业的主要挑战之一。本次大赛以此作为主题,具体的数据和要求如下:

内容

本次建模的目标是识别交易是否欺诈,提供的数据集为某行某月一部分信用卡客户在两天内发生的交易,训练集包含256327条交易记录,有443条为欺诈交易,测试集28480条,需要参赛者提交预测结果。数据集高度不平衡,正类(欺诈)占所有交易的0.172%。

数据集中只包含数值型变量,由于数据保密性问题,我们不能提供原始特征和数据上的更多背景信息,除‘Time’和‘Amount’外的其他变量都进行了PCA变换,其中特征V1,V2,…,V28是由PCA得到的主成分。特征‘Time’包含每个交易和第一天00:00:00之间经过的秒数,‘Amount’是该笔交易的金额。特征‘Class是预测的目标变量,在欺诈的情况下取值为1,否则为0。

提交方式

每个参赛队伍需要提交测试集的预测结果的csv文件,文件名为队伍名_预测结果.csv,内容格式如下:

Index(序号),Pred(预测概率),Class(结果)

1,0.92,  1

2,0.13,  0

3,0.24,  0

4,0.55,  0

5,0.12,  1

对于此次的信用卡交易欺诈预测,我们采用Precision-Recall Curve (AUPRC)作为评价方式。

每只队伍都需要提交相应的比赛报告,你们可以使用你们喜欢的工具(Jupyter Notebook,Microsoft office等)来生成你们的报告,但你们的报告必须能采用HTML,PDF,PPT,WORD这些通用格式。你们的代码应采用一个单独的压缩文件包提交,且与你们的预测结果文件和报告分开。你们的代码将不会被评分,但你的结果必须包含你的代码,否则不会被打分。

我们强烈建议你们采用Jupyter  Notebook来进行数据的处理、探索、建模。

请尽量采用python,R作为建模工具,其他语言在决赛环境中可能无法使用。如果有什么其他的问题,请联系群里的工作人员,我们会给你们提供一些建议。

  全套毕业设计论文现成成品资料请咨询微信号:biyezuopin QQ:2922748026     返回首页 如转载请注明来源于www.biyezuopin.vip  

                 

打印本页 | 关闭窗口
本类最新文章
30米跨度幕布悬挂系统设计 答辩 基于微信小程序的家校互动系统的设 基于RobotStudio的AB
开始运动链机械臂适应成品堆场物料 索道穿梭机瞬态横风流场CFD仿真 基于MySQL与PHP技术的学生
| 关于我们 | 友情链接 | 毕业设计招聘 |

Email:biyeshejiba@163.com 微信号:biyezuopin QQ:2922748026  
本站毕业设计毕业论文资料均属原创者所有,仅供学习交流之用,请勿转载并做其他非法用途.如有侵犯您的版权有损您的利益,请联系我们会立即改正或删除有关内容!