csvファイルを複数の小さなファイルに分割する方法は?

はじめに

大きなCSVを数式を使わずに簡単に小さなファイルに分割したり すべての出力ファイルには同じ行数のデータが含まれています 。csvファイルのみをアップロードし、数秒で結果を取得します。簡単で効率的な処理-今すぐお試しください!

CSV ファイルを複数の小さなファイルに分割する方法

大きなファイルを小さなファイルに分割するのは簡単ではありません。たとえば、作業中にこのようなシナリオが数多く発生し、注文データを保存するcsvファイルがあり、その中に数百万行が含まれている場合があります。これを入れる必要があります。ファイルは同じサイズの複数のcsvファイルに分割されています。どうやったらできるの?以下の手順とガイドに従って、製品の詳細と効果的な使用方法をご覧ください。

大きな CSV ファイルや Excel ファイルを小さなファイルに分割する方法はいくつかあります。

  • Excel の使用:大きいファイルを Excel で開き、データの分割に使用する列のデータを並べ替えます。次に、小さいファイルごとにデータを選択してコピーし、新しいワークブックに貼り付けます。新しいワークブックはそれぞれ別のファイルとして保存します。
  • Python などのスクリプト言語を使用する:pandas ライブラリを使用して大きなファイルを読み込み、次に pandas メソッドを使用してデータを小さなデータフレームに分割し、最後に各データフレームを別の CSV ファイルに書き込みます。
  • SQL などのデータ管理ツールを使用する:大きなファイルをデータベースにインポートし、SQL クエリを使用してデータを小さなテーブルに分割し、各テーブルを個別の CSV ファイルとしてエクスポートします。
  • split などのコマンドラインツールを使用する:大きいファイルがプレーンテキストファイル (CSV) の場合、ターミナルの「split」コマンドを使用して小さなファイルに分割できます。たとえば、「split-l 20000 largefile.csv splitfile_」と入力すると、largefile.csv は splitfile_aa、splitfile_ab などの名前の付いた複数のファイルに分割されます。各ファイルには 20000 行が含まれます。

Python を使えるなら、大きな csv ファイルを小さなファイルに分割できます。

以下は、pandas ライブラリを使用して大きな CSV ファイルを特定の列に基づいて小さなファイルに分割する Python コードのサンプルです。


import pandas as pd

# read the large csv file into a pandas dataframe
df = pd.read_csv('largefile.csv')

# get the unique values of the column you want to split the data by
column_values = df[column_name].unique()

# loop over the unique values of the column
for value in column_values:
    # create a dataframe for each unique value
    value_df = df[df[column_name] == value]

    # write the dataframe to a new csv file
    value_df.to_csv(f'{column_name}_{value}.csv', index=False)

最善の方法:QuickTran機能を使用する

  • 当社のウェブサイトにアクセスして、オンラインツールを見つけてください。
  • [ファイルを選択] ボタンをクリックし、変更するファイルを選択して、CSV ファイルを開きます。
  • ファイルがアップロードされたら、分割したい番号を入力できます。数秒で、大きなCSVを小さなファイルに分割します。
  • その後、ファイルをダウンロードしてコンピューターに保存できます。
その他のトランスフォーメーションツールをご覧ください
データの変換:テキスト、日付/時刻、場所、JSON など