通过本编文章,快速了解Power Query的列操作,提高数据清理效率。包括操作有:
重命名列
拆分列
重复列
合并列
提取列
索引列
条件列
自定义列
列分组
一、示例数据
全国的每个店铺中,每个销售员的销售订单数据。字段包括:店铺名称、销售单编号、员工工号、销售员姓名、该笔订单的销量、该笔订单的销售金额、该笔订单的对应的标价金额。
二、界面化的操作模式
对列的操作,通过Power Query查询编辑器的界面就可以完成大部分常用的操作。
三、详细操作
重命名列
拆分列:按分隔符“-”进行拆分等。拆分列来取得列中某部分内容,比如本例中销售单编号中包含的日期信息。
重复列:就是复制生产新列。把“销售单编号”拆分出来的年、月、日复制一下。
合并列:把拆分的销售单编号,通过合并列合并回来。
提取列:前面通过“拆分列”然后复制保留的方式。使用提取列可以一步直接完成。利用高级选项,完成提取年、月、日。
添加索引列:通过索引列,来给每行数据一个独立的ID标志。
添加条件列:根据已有列的信息,按条件生产需要的新列的数据。比如本例中根据“销售金额”是否大于500元,来判断订单是否大单。
添加自定义列:通过公式任意生成自定义列。
分组依据:对数据进行分组汇总。本例对每个店铺的销售金额进行分组汇总,生成“店铺销售总额”的新列。