Python 数据分析模块pandas 如何创建DataFrame

时间:2024-03-25 18:27:50

以下用两种方式分别创建DataFrame。

import pandas as pd

#原始数据存储在列表中
names = ['Alice','Deric','Amanda','Petter']
ages = ['34','24','33','35']
incomes = ['50000','65000','46000','69000']

# 使用字典创建 DataFrame
data = {'names':names,
        'ages':ages,
        'incomes':incomes}
df1 = pd.DataFrame(data)

#使用zip函数创建 DataFrame
df2 = pd.DataFrame(data=zip(names,ages,incomes),
                     columns = ['names','ages','incomes'])

print(df1)
print('\n')
print(df2)

zip() 是 Python 内置函数,用于将多个可迭代对象(例如列表、元组等)中对应位置的元素打包成一个个元组,然后返回由这些元组组成的迭代器。这样可以方便地将多个列表或元组中的数据一一对应地组合起来。

例如,如果有两个列表 a = [1, 2, 3]b = ['a', 'b', 'c'],可以使用 zip() 函数将它们打包成一个迭代器,然后遍历这个迭代器来获取对应位置的元素:

a = [1, 2, 3]
b = ['a', 'b', 'c']

zipped = zip(a, b)
for item in zipped:
    print(item)

输出结果:

(1, 'a')
(2, 'b')
(3, 'c')