《关于原始数据异常值处理.docx》由会员分享,可在线阅读,更多相关《关于原始数据异常值处理.docx(2页珍藏版)》请在优知文库上搜索。
1、异常值处理前1 .数据中存在NAN值15.540000000000015.5100000000000NaN15.390000000000015.2300000000000data=data(isnan(data);剔除NAN值2 .数据中存在部分值扩张为理论值10倍19.560000000000019.7400000000000196.51000000000016.550000000000016.5300000000000t=find(data80);data(t)=data(t)/10;对这部分值降低10倍;3 .数据中存在部分异常值跳变15.040000000000015.18000000
2、0000015.I100ooooooooo114.91000000000015.080000000000015.0800000000000步躲2处理后会存在跳变值forj=2:length(data)-2ifabs(data(j)-data(j-1)1.5ifabs(data(j+l)-data(j)1.5data(j)=(data(j-l)+data(j+l)/2;endifabs(data(j+l)-data(j)1.5deta=(data(j+2)-data(j-l)/3;data(j)=data(j-l)+deta;data(j+l)=data(j)+deta;endendend对该异常值取前后位均值覆盖注:适用于单个异常值,或连续两个异常值,若存在连续三个异常值,则算法将无法正常剔除。异常值处理后:(与上图为同一数据表图)Einmmm最终还是有不少数据处理效果并不理想.存在明显跳变,但都是3个及以上的异常值连续出现导致的。在选取数据集时先手动跳过避免选取这些图像。