《数据分析与挖掘实战》总结及代码练习---chap6 电力窃漏电用户自动识别

2019-04-14 21:06发布

  目录 6 电力窃漏电用户自动识别 背景: 分析方法与过程: 总结: 步骤: 数据抽取: 数据分析探索: 构建专家样本 用户实时诊断
 

6 电力窃漏电用户自动识别

背景:

传统: 防止窃漏电,定期巡逻,定期检验电表,用户举报窃电          缺点:对热的依赖性太强,目标不明确 现在: 计量异常报警功能,电能量数据查询 --> 电量异常,符合异常,终端报警,主站报警,线损异常—> 建立数据分析模型 --> 实时监测窃漏电情况 缺点: 终端误报 或者 漏报过多,建模时需要专家知识经验来判断,很大主观性,存在明显缺陷

分析方法与过程:

         窃漏电用户 只占很小一部分,还有一些大用户根本不可能漏电,应将这些大用户删除(比如银行税务,学校等)          终端报警 误报漏报 --> 数据预处理,数据探索 --> 总结偷漏点行为信息 历史窃漏电用户信息 整理出识别专家样本的数据集

总结

  1. 从电力计量系统,营销系统有选择抽取部分大用户用电电荷,终端报警以及违约窃电出发信息
  2. 样本探索分析,提出不可能的窃电漏电行业用户(白名单),初步审查正常用户和窃电漏电用户的用电特征
  3. 对样本数据进行预处理,包括数据清洗/缺失值处理/数据变换
  4. 构建专家样本集
  5. 构建窃电漏电用户识别模型
  6. 在线监听用户用电负荷以及终端报警,点用模型实时判断

步骤:

数据抽取:

营销系统抽取的数据: 1)用户基本信息: 用户名称,用户编号,用电地址,用电类别,报装容量,计量方式,电流电感变化,电压互感器变化 2)违约窃电处理记录 3)计量方法及依据 计量自动化系统 采集数据属性: 实时负荷:时间点/计量点/总有功功率/A/B/C相有功功率,ABC相电流,ABC相电压,ABC相功率因数 终端报警 样本规模: 不同用电类别的所有窃电用户 and 部分正常用户 (个人感觉比例1比1就好了,类别均衡) 开始时间 结束时间: 窃漏电的关键时间节点,用电 报警数据 特征 变化,样本抽取时,包含时间节点前后一定范围的数据: 根据负荷数据,计算当天的 用电量:(mi每隔15min的有功功率,累加求和得到当天用电量)

数据分析探索:

分布分析: 不同用电类别 窃漏电用户分布情况: 非居民类别不存在窃漏电情况,故接下来的分析中不考虑非居民类别的用电数据 周期性分析 正常用电量探索分析:用量比较平稳,没有太大波动 窃漏电用电量探索分析:用电能量出现明显下降趋势,用户异常用电电量指标 数据清洗: 过滤冗余数据:(业务建模相关需要,筛选需要的数据)              非居民用电类删除; 节假日用电量 相对平时用电量 明显偏低,过滤 缺失值处理: 若将缺失值删除,严重影响供出电量的计算结果,导致日线损率数据误差过大à 因此需要对缺失值进行处理 数据变换:              作为构建模型的专家样本,特征不明显,需要进行重新构造:              窃电评价指标体系: 电量趋势下降指标:用电量趋势
窃漏电用户的用电量呈下降趋势,用直线拟合得到的斜率作为衡量,如果斜率不断下降,那么该用户窃漏电的可能性很大,取前五天和后五天分别为统计窗口,计算电量趋势:
ki第i天的电量趋势,11天的用电量下降指标为T: 线损质指标线损增长率
结合线户拓扑关系,计算出用户所属线路在当天的线损率,一条线路上同时供给多个用户,第l天的线路供电量为sl,线路上各个用户的总用电量, 线路的线损率:
    
若当天发生漏电,则线损率会上升,但是会存在波动,因此考虑前后几天的平均值,判断其增长率是否大于1%(这个阈值的确定也需要经验或者分析来确定),定义Vi1, Vi2,前5天与后5天的增长率,若Vi1> Vi2,1%,认为具有窃电嫌疑,指标:
告警类指标 与窃漏电有关的终端告警数
            该指标主要与电压缺相,电压断相,电流反极性等警告,计算            次数之和 作为告警类指标

构建专家样本

将新构建的指标以及用户信息还有时间 汇总,加上当天是否偷漏电 的标签,得到专家样本库

用户实时诊断

与实际稽查结果对比,正确识别窃电用户10个,错误判断用户为窃漏电用户1个。诊断没有发现的窃电用户4个,整体来看窃电准确率很高。 针对漏判的,研究漏电期间的行为,优化模型特征,提高识别准确率