CC拿到了一份2018.01.01–2019.06.30平台销售订单数据。她需要对这份数据进行清洗。 这份数据在工作目录下,文件名是"180101-190630交易数据.csv"。路径为:“180101-190630交易数据.csv”。数据集简介如下: 各个字段的要求如下: id,作为index order_id,不存在<=0的异常值,不存在重复值 user_id,不存在<=0的异常值 payment,不存在<0的异常值,转化成单位元 price,不存在<0的异常值,转化成单位元 items_count,不存在<0的异常值 cutdown_price,不存在<0的异常值,转化成单位元 post_fee,不存在<0的异常值,转化成单位元 create_time,pay_time,转化成时间格式,不存在create_time>pay_time的异常值 数据集中,是否存在缺失值、异常值、重复值,需要自行进行判断。然后再进行处理。 最后,用输出清洗后的结果。
本文地址:http://syank.xrbh.cn/quote/7380.html 迅博思语资讯 http://syank.xrbh.cn/ , 查看更多