如何将csv文件拆分为多个小文件?

导言

无需公式即可轻松将大型 csv 拆分成小文件 每个输出文件都包含相同行数的数据 。仅上传 csv 文件,在几秒钟内获得结果。轻松高效的处理-立即试用!

如何将 csv 文件拆分成多个小文件

将大文件拆分成小文件并不是一件很简单的事情。例如,我们在工作中会遇到很多这样的场景,我们可能有一个保存订单数据的 csv 文件,其中有数百万行。我们需要把这个文件分成几个大小相似的 csv 文件。我们怎么能做到?请按照以下步骤和指南详细了解我们的产品以及如何有效使用它。

有几种方法可以将大型 CSV 或 Excel 文件拆分成较小的文件:

  • 使用 Excel:在 Excel 中打开大文件,对要用于拆分数据的列上的数据进行排序,然后选择并复制每个较小文件的数据并将其粘贴到新的工作簿中。将每个新工作簿另存为一个单独的文件。
  • 使用 Python 等脚本语言:使用 pandas 库读取大文件,然后使用 pandas 方法将数据拆分成更小的数据框,最后将每个数据框写入单独的 CSV 文件。
  • 使用诸如 SQL 之类的数据管理工具:将大文件导入数据库,然后使用 SQL 查询将数据拆分成较小的表,并将每个表导出为单独的 CSV 文件。
  • 使用诸如 split 之类的命令行工具:如果大文件是纯文本文件 (CSV),则可以使用终端中的 “拆分” 命令将其拆分成较小的文件。例如,“split-l 20000 largefile.csv splitfile_” 会将 largefile.csv 拆分成多个文件,每个文件包含 20000 行,名称如 splitfile_aa、splitfile_ab 等。

如果你能使用 Python,你可以将大 csv 文件拆分成小文件:

以下是使用 pandas 库根据特定列将大 CSV 文件拆分成较小文件的 Python 代码示例:


import pandas as pd

# read the large csv file into a pandas dataframe
df = pd.read_csv('largefile.csv')

# get the unique values of the column you want to split the data by
column_values = df[column_name].unique()

# loop over the unique values of the column
for value in column_values:
    # create a dataframe for each unique value
    value_df = df[df[column_name] == value]

    # write the dataframe to a new csv file
    value_df.to_csv(f'{column_name}_{value}.csv', index=False)

最好的方法:使用 QuickTran 函数

  • 访问我们的网站并找到在线工具。
  • 单击 “选择文件” 按钮并选择要更改的文件,打开 csv 文件。
  • 文件上传后,您可以输入要拆分的数字。在几秒钟内,你会将大 csv 拆分成小文件。
  • 然后,您可以下载文件并将其保存到您的计算机上。
了解我们的更多转型工具
转换数据:文本、日期/时间、位置、Json 等。