数据仓库和数据挖掘技术在信用卡分析中的应用_论文


维普资讯 http://www.cqvip.com 山东 省滨 州职 业学 院计算 机信 息科 学 系 山东 省滨 州市 人 民银 行 程宝 安  赵林 明  随 着信用 卡业 务 的发 展 ,银行 积 累 了大量 客 户交 易数  据, 如何 利用客 户 的特征 数据和 交 易数据 , 得客 户的行 为  获 数据 挖掘 的过 程是 一 个不 断 反馈 的过程 ,可以 粗略 地  分 为 :问题 定 义 ( s  D f iin) Ta k ei to 、数据 收 集和 预处 理  n ( t  r p r to   n   r p o esn 、数 据挖 掘算 法  Daa P e a a in a d P e rc sig) 模式 , 而更 好地 为客 户服 务 、 高效 益 , 从 提 是信 用卡 管理 中  迫 切 需要 解决 的 问题 。数 据 仓库 和数 据挖 掘技 术在 信 用卡  执 行 ,以及 结 果 的解 释 和 评估 (nt r e a i n a   I e pr t t o   nd 分析 中的应 用较 好地解 决 了这个 问题 。   E au t n)四个阶 段 。 v lai o   数 据 挖掘 技 术的 基础是 人 工智 能 ,但 它只 是利 用人 工  一 . 数据仓库和数据挖掘技术  智 能 中一些 已经成 熟 的算法 和技 术 , 如人 工神 经 网络 、 传  遗 数据仓 库 ( DW , Daa Wa e o s )是一 个面 向主 题  算 法 、决 策树 、邻 近搜 索算 法 、规 则推 理 、模糊 逻辑 等 。虽  t  rh u e 的 、 成 的 、 对稳 定的 、反映 历 史变化 的数据 集 合 ,用于  然 数据 挖掘 不一 定非 要 建立 在数据 仓库 上 ,但 如果 数据 挖  集 相 支持 管理决 策 。 对此 可 以从 两 个层次 进行 理解 , 首先 , 据  掘 能 与数据 仓库 协 同工 作 ,则能 大大提 高 数据 挖掘 的工 作  数 仓 库 用于支 持决 策 , 向分析 型数据 处理 , 不同于 企业 现  效率 , 更好地 满 足决策 的需 要 。因为数据 仓库 在纵 向 ( 面 它 能 历  有的操 作型 数据库;其次 , 数据 仓库是 对 多个异 构数 据源 的  史 数据 ) 横 向 ( 业 范 围内的数 据 ) 面都 为数据 挖掘 提  和 企 方 供 了更 为广 阔的 活动空 间 , 数据 仓库 完成 了数据 的 收集 、 集  成 、 储 、清洗 等工作 , 据挖 掘面 对的 是经过 初步 加工 的  存 数 有效集 成 , 集成 后按 照主题 进行 重组 , 包含 历史数据 , 并 而  且 存放 在数据 仓库 中的数据 一般 不再修 改 。   数据挖 掘 ( M , Daa Miig) 从大 型数据 库 的数  数据 ,这使 它能 更专注 于发 现知 识 。 D t  nn 是   据 中抽 取 出潜 在 的 、 有价 值的知 识 、 型或规 则 的过 程 。 模 数  数 据 仓 库和 数 据 挖 掘之 间有 着 内在 的 联 系和 互 补 性 ,   据 挖掘 的对 象可 为数据 库 , 也可 为文 件 系统 , 其他 任何 组  数 据 挖掘 技 术要 发 挥潜 力 ,就 必须 和 数据 仓 库 结 合起 来 。 或   织 在一 起的数 据集 合 。 确切 地说 , 数据 挖 掘是一 种决 策支 持  过 程 ,它主 要基于 人工 智能 、 器学 习 、 计学 技术 , 度  机 统 高 D w+ M 的 结构 是决 策支持 的 有效 方 案 。此 项技 术在信 用  D 卡 分析 中的 应用 ,为信 用卡 管理 人 员做 出决策 提供 了科 学  自动化 地分析 企业 原 有的数据 , 出归纳性 的推 理 , 中挖  依据 。 做 从   掘 出潜 在模式 ,帮助决 策者 做 出正确决 策 。   【】 信 用 卡 l国 2 0 .8 5 0 6o  5   维普资讯 http://www.cqvip.com i  素 二  在信用卡分析中的应用  1信 用卡 数据 仓库 的体 系结构  . 信 用卡 数据 仓库 的体 系结构 如 图 1 示 ,由 四部 分 组  所 成。   信 用卡 数据 仓库 中的第一 部 分 ,是银 行信 用 卡部 门客  对于 信 用卡 资信分 析主 题 来说 ,将 从前 端得 来的 交 易数 据  经过转 换作 为 基础数据 , 照时 间进 行综 合 , 别形 成 月数  按 分 据 、季数据 、年 数据 装入信 用卡 数据 仓库 。   2 用 判定树 方法 挖掘信 用 卡数 据中的 客户 分类 规则  . ( )判定树 归纳 算法  1 输 入 :训 练样 本 ( a ls , 由离 散值 属性表 示 ;候  S mpe ) 选属性 集合 atiu e t t  trb t ̄i 。 s 户的特征 数据 和交 易数据 ( 括 历史数据 、 务数 据和 其他  包 业 数据 ) 是 信用 卡现 有业 务系统 数据 源 ,其数 据特 点是 分散  , 的和 难以 再次 利用 的 。   输 出 :一棵 判定 树 。’   算法 :   ①创建 节点 N;   第 二部分 是 中心 数据 仓库 ,由数据 仓 库和 多维 数据 库  组成 , 源数 据经 过抽 取 、 清洗和 转换 之后加 载 到信 用卡数 据  仓库 中; 储于 多维 数据库 中的数据 是经过 再 次加 工的 , 存 为  信用 卡分析 与 决策提 供 了必要 的分析 基础 。   ②如果 S mpe 都 在 同一个 类 C,则 进行 ③ l a ls   ③返 回 N作 为叶节 点 ,以类 C标记 ;   ④如果 atiu Ai 为空 ,则进 行

相关文档

数据挖掘和数据仓库技术在个人信用系统中的应用
数据挖掘与数据仓库技术在电子商务中的应用综述
数据仓库和数据挖掘技术在保险公司中的应用
浅析数据仓库及数据挖掘技术在ERP中的应用
数据仓库及数据挖掘技术在电信CRM中的应用
基于数据仓库的数据挖掘技术在保险业中的应用研究
基于数据仓库的数据挖掘技术在高校图书馆管理中的应用
基于数据仓库和数据挖掘技术的数字化校园应用研究
电脑版