家修资讯 > 家电维修 > 电脑维修 > 数据挖掘的基本步骤是什么

找不到附近家电维修师傅?

一键下单

数据挖掘的基本步骤是什么

发布时间:2022-12-08 14:38:01 来源:闪电家修网 阅读量:968

本文操作环境:windows10系统、thinkpad t480电脑。

具体步骤如下:

1、定义问题

在开始知识发现之前最先的也是最重要的要求就是了解数据和业务问题。必须要对目标有一个清晰明确的定义,即决定到底想干什么。比如,想提高电子信箱的利用率时,想做的可能是“提高用户使用率”,也可能是“提高一次用户使用的价值”,要解决这两个问题而建立的模型几乎是完全不同的,必须做出决定。

2、建立数据挖掘库

建立数据挖掘库包括以下几个步骤:数据收集,数据描述,选择,数据质量评估和数据清理,合并与整合,构建元数据,加载数据挖掘库,维护数据挖掘库。

3、分析数据

分析的目的是找到对预测输出影响最大的数据字段,和决定是否需要定义导出字段。如果数据集包含成百上千的字段,那么浏览分析这些数据将是一件非常耗时和累人的事情,这时需要选择一个具有好的界面和功能强大的工具软件来协助你完成这些事情。

4、准备数据

这是建立模型之前的最后一步数据准备工作。可以把此步骤分为四个部分:选择变量,选择记录,创建新变量,转换变量。

5、建立模型

建立模型是一个反复的过程。需要仔细考察不同的模型以判断哪个模型对面对的商业问题最有用。先用一部分数据建立模型,然后再用剩下的数据来测试和验证这个得到的模型。有时还有第三个数据集,称为验证集,因为测试集可能受模型的特性的影响,这时需要一个独立的数据集来验证模型的准确性。训练和测试数据挖掘模型需要把数据至少分成两个部分,一个用于模型训练,另一个用于模型测试。

6、评价模型

模型建立好之后,必须评价得到的结果、解释模型的价值。从测试集中得到的准确率只对用于建立模型的数据有意义。在实际应用中,需要进一步了解错误的类型和由此带来的相关费用的多少。经验证明,有效的模型并不一定是正确的模型。造成这一点的直接原因就是模型建立中隐含的各种假定,因此,直接在现实世界中测试模型很重要。先在小范围内应用,取得测试数据,觉得满意之后再向大范围推广。

7、实施

模型建立并经验证之后,可以有两种主要的使用方法。第一种是提供给分析人员做参考;另一种是把此模型应用到不同的数据集上。

免费学习视频分享:编程入门

免责声明:本网站转载内容均来自网络,若涉及侵权请务必联系删除,本网站转载内容均来自网络,若涉及侵权请务必联系删除,本网站转载内容均来自网络,若涉及侵权请务必联系删除。
相关标签:

推荐服务

更多...

热门问答

更多...
选购洗衣机的10个基本常识
选购洗衣机的10个基本常识是:1、查看指标。2、观察磨损率。3、洗净的程度。4、耗电量以及耗水量。5、噪声和故障的出现率。6、选择3C认证的品牌。7、观察机器的 已有 1个问答

2023-02-08 10:46:40

挖掘机空调不凉什么原因
1、可能是因为空调的功率不够导致制冷差。2、可能是因为外机装在较封闭的空间或外机周围的温度过高,容易导致散热器散出来的热量没有办法流走从使得空调制冷差或 已有 1个问答

2023-02-28 11:48:43

电视检索数据如何取消
电视自动搜索结束之后。按确定键就可以自动保存电视节目。然后出现【发现新的节目是否自动搜索】,这时候不要按确定,也不要按取消,直接关闭机顶盒就可以了。1 已有 1个问答

2023-02-09 17:12:42

更换锁的步骤有哪些,跟换锁的方法
换锁的步骤可以通过DIY的方式来解决,首先需要确认自己家庭的锁芯的型号,基本上大家可以使用这样的方法,首先是把门锁上的螺丝钉拆卸下来,然后我们可以把里面的锁芯给取下来,这时候我们只需要拍一张照片,然后用刻度尺量一量它的具体尺寸就可以了 已有 1个问答

2020-12-01 16:09:35

换锁芯的步骤,跟换锁芯的方法
更换锁芯的步骤比较复杂,如果说自己想要避免出现其他的麻烦的话,可以拨打小区附近的换锁工人的电话,请他们上门维修,具体的维修步骤比较简单,首先是让他们判断一下我们锁芯的型号是怎样的,基本上普通的门锁,使用的是同一款的锁芯。 已有 1个问答

2020-12-01 16:09:35

精选
优选
为你
推荐
自助
下单
客服
顶部
扫码关注公众号

扫码关注公众号

 

7X24小时报修热线

扫码下单享立减

扫码下单享立减

 

全国免费报修热线

-->