目录
6 电力窃漏电用户自动识别
背景:
分析方法与过程:
总结:
步骤:
数据抽取:
数据分析探索:
构建专家样本
用户实时诊断
6 电力窃漏电用户自动识别
背景:
传统:
防止窃漏电,定期巡逻,定期检验电表,用户举报窃电
缺点:对热的依赖性太强,目标不明确
现在:
计量异常报警功能,电能量数据查询 --> 电量异常,符合异常,终端报警,主站报警,线损异常—> 建立数据分析模型 --> 实时监测窃漏电情况
缺点: 终端误报 或者 漏报过多,建模时需要专家知识经验来判断,很大主观性,存在明显缺陷
分析方法与过程:
窃漏电用户 只占很小一部分,还有一些大用户根本不可能漏电,应将这些大用户删除(比如银行税务,学校等)
终端报警 误报漏报 --> 数据预处理,数据探索 --> 总结偷漏点行为信息
历史窃漏电用户信息
整理出识别专家样本的数据集
总结:
- 从电力计量系统,营销系统有选择抽取部分大用户用电电荷,终端报警以及违约窃电出发信息
- 样本探索分析,提出不可能的窃电漏电行业用户(白名单),初步审查正常用户和窃电漏电用户的用电特征
- 对样本数据进行预处理,包括数据清洗/缺失值处理/数据变换
- 构建专家样本集
- 构建窃电漏电用户识别模型
- 在线监听用户用电负荷以及终端报警,点用模型实时判断
步骤:
数据抽取:
营销系统抽取的数据:
1)用户基本信息:
用户名称,用户编号,用电地址,用电类别,报装容量,计量方式,电流电感变化,电压互感器变化
2)违约窃电处理记录
3)计量方法及依据
计量自动化系统 采集数据属性:
实时负荷:时间点/计量点/总有功功率/A/B/C相有功功率,ABC相电流,ABC相电压,ABC相功率因数
终端报警
样本规模:
不同用电类别的所有窃电用户 and
部分正常用户 (个人感觉比例1比1就好了,类别均衡
)
开始时间 结束时间:
窃漏电的关键时间节点,用电 报警数据 特征 变化,样本抽取时,包含时间节点前后一定范围的数据:
根据负荷数据,计算当天的 用电量:(mi每隔15min的有功功率,累加求和得到当天用电量)
数据分析探索:
分布分析:
不同用电类别 窃漏电用户分布情况:
非居民类别不存在窃漏电情况,故接下来的分析中不考虑非居民类别的用电数据
周期性分析
正常用电量探索分析:用量比较平稳,没有太大波动
窃漏电用电量探索分析:用电能量出现明显下降趋势,用户异常用电电量指标
数据清洗:
过滤冗余数据:(业务建模相关需要,筛选需要的数据)
非居民用电类删除;
节假日用电量 相对平时用电量 明显偏低,过滤
缺失值处理:
若将缺失值删除,严重影响供出电量的计算结果,导致日线损率数据误差过大à 因此需要对缺失值进行处理
数据变换:
作为构建模型的专家样本,特征不明显,需要进行重新构造:
窃电评价指标体系:
电量趋势下降指标:用电量趋势
窃漏电用户的用电量呈下降趋势,用直线拟合得到的斜率作为衡量,如果斜率不断下降,那么该用户窃漏电的可能性很大,取前五天和后五天分别为统计窗口,计算电量趋势:
ki第i天的电量趋势,11天的用电量下降指标为T:
线损质指标线损增长率
结合线户拓扑关系,计算出用户所属线路在当天的线损率,一条线路上同时供给多个用户,第l天的线路供电量为sl,线路上各个用户的总用电量
, 线路的线损率:
若当天发生漏电,则线损率会上升,但是会存在波动,因此考虑前后几天的平均值,判断其增长率是否大于1%(这个阈值的确定也需要经验或者分析来确定),定义Vi1, Vi2,前5天与后5天的增长率,若Vi1> Vi2,1%,认为具有窃电嫌疑,指标:
告警类指标 与窃漏电有关的终端告警数
该指标主要与电压缺相,电压断相,电流反极性等警告,计算 次数之和 作为告警类指标
构建专家样本
将新构建的指标以及用户信息还有时间 汇总,加上当天是否偷漏电 的标签,得到专家样本库
用户实时诊断
与实际稽查结果对比,正确识别窃电用户10个,错误判断用户为窃漏电用户1个。诊断没有发现的窃电用户4个,整体来看窃电准确率很高。
针对漏判的,研究漏电期间的行为,优化模型特征,提高识别准确率