(1)违背常识的错误 比如调查上海市某小区居民的月收入,出现了小王的收入为-5000,这就属于异常值 (2)数据的离群值 离群值是指与其他数据差异较大,会对数据分析结果产生影响的观测值,比如说一个人月收入是1000000000000000000000000元 离群值的判断和处理: (3)数据格式不一样 比如其他数字都是5000,10000,1000这样,有几个是999,
数据异常的三种主要类型
1.检查同一客户原表里面是否有同样的数值
2.再检查这个数据是怎样收集来的
3.从技术角度评估是否是离群,如何对离群进行处理
要考虑是否技术人员用999来填补空缺值?或者是这个人随便乱填的?系统中是否是可选值?
本网页所有视频内容由 imoviebox边看边下-网页视频下载, iurlBox网页地址收藏管理器 下载并得到。
ImovieBox网页视频下载器 下载地址: ImovieBox网页视频下载器-最新版本下载
本文章由: imapbox邮箱云存储,邮箱网盘,ImageBox 图片批量下载器,网页图片批量下载专家,网页图片批量下载器,获取到文章图片,imoviebox网页视频批量下载器,下载视频内容,为您提供.
阅读和此文章类似的: 全球云计算