Power Query列操作快速了解(1)

时间:2024-03-14 22:09:42

通过本编文章,快速了解Power Query的列操作,提高数据清理效率。包括操作有:

重命名列

拆分列

重复列

合并列

提取列

索引列

条件列

自定义列

列分组

一、示例数据

全国的每个店铺中,每个销售员的销售订单数据。字段包括:店铺名称、销售单编号、员工工号、销售员姓名、该笔订单的销量、该笔订单的销售金额、该笔订单的对应的标价金额。

Power Query列操作快速了解(1)

二、界面化的操作模式

对列的操作,通过Power Query查询编辑器的界面就可以完成大部分常用的操作。Power Query列操作快速了解(1)

Power Query列操作快速了解(1)

三、详细操作

重命名列

Power Query列操作快速了解(1)

拆分列:按分隔符“-”进行拆分等。拆分列来取得列中某部分内容,比如本例中销售单编号中包含的日期信息。

Power Query列操作快速了解(1)

Power Query列操作快速了解(1)重复列:就是复制生产新列。把“销售单编号”拆分出来的年、月、日复制一下。

Power Query列操作快速了解(1)

合并列:把拆分的销售单编号,通过合并列合并回来。

Power Query列操作快速了解(1)

提取列:前面通过“拆分列”然后复制保留的方式。使用提取列可以一步直接完成。利用高级选项,完成提取年、月、日。

Power Query列操作快速了解(1)

Power Query列操作快速了解(1)

添加索引列:通过索引列,来给每行数据一个独立的ID标志。

Power Query列操作快速了解(1)

添加条件列:根据已有列的信息,按条件生产需要的新列的数据。比如本例中根据“销售金额”是否大于500元,来判断订单是否大单。

Power Query列操作快速了解(1)

添加自定义列:通过公式任意生成自定义列。

Power Query列操作快速了解(1)

分组依据:对数据进行分组汇总。本例对每个店铺的销售金额进行分组汇总,生成“店铺销售总额”的新列。

Power Query列操作快速了解(1)

Power Query列操作快速了解(1)