delimiter='\n'作用是什么
delimiter=' '是一个常见的参数设置,用于指定文本文件中的记录分隔符。在许多情况下,每条记录都是在新的一行开始,所以换行符( )被用作记录的分隔符。
下面演示如何将换行符使用作为分隔符来读取记录,并将这些记录连接成一个字符串后,传递给pandas.read_csv。
import pandas as pd
from io import StringIO
# 假设我们有一个从HDFS文件系统读取的reader对象,它返回一个每行一个记录的列表
reader = ["apple,1,red", "banana,2,yellow", "cherry,3,red"]
# 使用' '把这些行连接成一个字符串
data = ' '.join(reader)
# 现在我们可以将这个字符串传递给pandas.read_csv
df = pd.read_csv(StringIO(data), header=None, names=['fruit', 'quantity', 'color'])
# 打印结果DataFrame
print(df)
运行这段代码,你将看到如下输出:
fruit quantity color
0 apple 1 red
1 banana 2 yellow
2 cherry 3 red
在这个例子中,reader是一个列表,每个元素都是一个代表HDFS文件中一行的字符串。这些字符串首先被合并成一个单独的字符串,然后使用StringIO转换为文件类对象,并传递给pandas.read_csv以生成DataFrame。
关注公众号「水沐教育科技」,在手机上阅读所有教程,随时随地都能学习。内含一款搜索神器,免费下载全网书籍和视频。

微信扫码关注公众号