二十六、数据挖掘电力窃漏电用户自动识别

时间:2024-03-31 07:16:38

电力窃漏电用户自动识别

1. 综合案例数据预处理

电力窃漏电用户自动识别的内容

  • 背景与挖掘目标
  • 分析方法与过程
  • 数据探索性分析

综合案例的目标

  • 通过综合案例分析了解数据挖掘的整体流
  • 掌握使用sklearn工具库构建模型的具体方法
  • 窃漏电用户自动势必数据集详情
    二十六、数据挖掘电力窃漏电用户自动识别

2. 背景与挖掘目标

挖掘背景

  • 传统的防窃漏电方法主要通过定期巡检、定期校验电表、用户举报窃电等方法来发现窃电或计量装置故障。
  • 通过营销稽查人员、用电检查人员和计量工作人员利用计量异常报警功能和电能量数据查询功能开展用户用电情况等在线监控
  • 通过采集电量异常、负荷异常、终端报警等异常信息,并利用这些数据信息提取出窃漏电用户的关键特征,构建窃漏电用户的识别模型,就能自动检查、判断用户是否存在漏电行为。

挖掘目标

  • 归纳出切漏电用户的关键特征,构建且漏电用户的识别模型
  • 利用实时监测数据,调用窃漏电用户识别模型实现实时诊断
    企业大用户窃漏电通知书详情
    二十六、数据挖掘电力窃漏电用户自动识别

3. 分析方法与过程

窃漏电用户识别流程图
二十六、数据挖掘电力窃漏电用户自动识别

  • 窃漏电用户在电力计量自动化系统的监控大用户中只占一小部分,同时某些大用户也不存在窃漏电的行为,如银行、税务、学习和工商等非居民类别,故在数据预处理时有必要将这些用户剔除。

窃漏电用户识别的具体流程

  • 1、从电力计量自动化系统,营销系统有选择性地抽取部分大用户用电负荷、终端报警及违约窃电处罚信息等原始数据;

  • 2、对样本数据探索性分析,剔除不可能存在窃漏电行为行业的用户,即白名单用户,初步审视正常用户和窃漏电用户的用户特征;

  • 3、对样本进行预处理,包括数据清、缺失值处理和数据变换

  • 4、构建专家样本集

  • 5、构建窃漏电用户识别模型

  • 6、在线监测用户用电负荷及终端报警,调用模型实现实时诊断。

  • 1、选择聚类算法进行聚类,找到各簇质心;

  • 2、计算个对象到最近质心的距离;

  • 3、计算各对象到它的最近质心的相对距离;

  • 4、与给定的阈值作比较,选出离群点。

数据抽取的过程

  • 从营销系统抽取的数据
    1. 用户基本信息
    2. 违约、窃电处理记录
    3. 计量方法及依据
  • 从计量自动化系统采集的数据属性
    1. 实时负荷:时间点、计量点、总有功功率等
    2. 终端报警
      二十六、数据挖掘电力窃漏电用户自动识别
      其中,fl为第l天的用电量,mi为第l天每隔15分钟的总有功功率,对其累加求和得到当天用电量。

4 探索性数据分析

对窃漏电数据进行探索性分析,可以发现数据的内在规律特征,有助于选择合适的数据预处理和数据分析技术。
分布分析

  • 对2009年1月1日至2014年12月31日共5年所有的窃漏电用户进行分布分析,统计各个用电类别的窃漏电用户分布情况。
    二十六、数据挖掘电力窃漏电用户自动识别

周期性分析

  • 随机抽取一个正常用户和一个窃漏电用户,采用周期性分析对用电量进行探索。
  • 正常用户用电电量探索分析
    二十六、数据挖掘电力窃漏电用户自动识别
  • 窃漏电用电电量探索分析
    二十六、数据挖掘电力窃漏电用户自动识别

5 总结

电力窃漏电用户自动识别案例

  • 背景背景与挖掘目标

  • 分析方法与过程

  • 窃漏电用户识别流程图

    1. 数据抽取
  • 数据探索性分析

    1. 分布分析
    2. 周期性分析
    3. 窃漏电用电电量探索分析
  • 背景背景与挖掘目标

  • 分析方法与过程

  • 窃漏电用户识别流程图

    1. 数据抽取
  • 数据探索性分析

    1. 分布分析
    2. 周期性分析
    3. 窃漏电用电电量探索分析