Bir csv dosyasını satır sayısına göre nasıl bölersiniz?

Giriş

Büyük bir csv'yi formülsüz satır sayısına göre küçük dosyalara kolayca bölün Sadece csv dosyasını yükleyin, giriş” satır sayısı ”, Saniyeler İçinde Sonuç Alın. Zahmetsiz ve Verimli İşleme - Şimdi Deneyin!

Bir csv dosyasını satır sayısına göre nasıl bölersiniz?

Günlük işlerimizde genellikle bir dosyayı küçük dosyalara bölmemiz gerekir. Örneğin, 1 milyon satırlı bir dosyaya sahibim ve her 100.000 satıra sahip bir dosyaya bölmek istiyorum. Bu basit bir mesele değildir ve bazen programlamanız gerekir.

Büyük bir CSV veya Excel dosyasını daha küçük dosyalara bölmenin birkaç yolu vardır:

  • Excel'i kullanma: Büyük dosyayı Excel'de açın, verileri bölmek için kullanmak istediğiniz sütundaki verileri sıralayın, ardından her küçük dosya için verileri seçip kopyalayın ve yeni bir çalışma kitabına yapıştırın. Her yeni çalışma kitabını ayrı bir dosya olarak kaydedin.
  • Python gibi bir komut dosyası dili kullanma: Büyük dosyada okumak için pandalar kitaplığını kullanın, ardından verileri daha küçük veri alanlarına bölmek için pandalar yöntemlerini kullanın, ve son olarak her veri özetimini ayrı bir CSV dosyasına yazın.
  • SQL gibi bir veri yönetimi aracı kullanma: Büyük dosyayı bir veritabanına aktarın, ardından verileri daha küçük tablolara bölmek ve her tabloyu ayrı bir CSV dosyası olarak dışa aktarmak için SQL sorgularını kullanın.
  • Bölme gibi bir komut satırı aracı kullanma: Büyük dosya düz metin dosyasıysa (CSV), bir terminaldeki “böl” komutunu kullanarak onu daha küçük dosyalara bölebilirsiniz. Örneğin, “split -l 20000 largefile.csv splitfile_”, largefile.csv dosyasını splitfile_aa, splitfile_ab, vb. Gibi adlarla 20000 satır içeren birden çok dosyaya böler.

Büyük bir CSV veya Excel dosyasını daha küçük dosyalara bölmek için Microsoft Excel'i kullanabilirsiniz. İşte nasıl:

  • Büyük dosyayı Microsoft Excel'de açın.
  • Verileri daha küçük dosyalara bölmek için kullanmak istediğiniz sütuna göre verileri sıralayın.
  • İlk küçük dosyanın verilerini seçin ve kopyalayın.
  • Microsoft Excel'de yeni bir çalışma kitabı oluşturun.
  • Kopyalanan verileri yeni çalışma kitabına yapıştırın.
  • Yeni çalışma kitabını ayrı bir dosya olarak kaydedin.
  • Her ek küçük dosya için 3-6 numaralı adımları tekrarlayın.

not: Her küçük dosyadaki satır sayısı, her yeni çalışma kitabına kopyalayıp yapıştırmayı seçtiğiniz satır sayısına bağlı olacaktır.

İşte Python ve pandalar kullanarak satır sayısına göre büyük bir CSV dosyasının daha küçük dosyalara nasıl bölüneceğine dair bir örnek:


import pandas as pd

# Read the large csv file into a pandas dataframe
df = pd.read_csv("largefile.csv")

# Set the number of rows per file
rows_per_file = 5000

# Get the total number of rows
total_rows = df.shape[0]

# Calculate the number of files needed
num_files = total_rows // rows_per_file + (total_rows % rows_per_file > 0)

# Split the data into smaller dataframes
for i in range(num_files):
    start = i * rows_per_file
    end = (i + 1) * rows_per_file
    filename = f"split_file_{i}.csv"
    df.iloc[start:end].to_csv(filename, index=False)

En iyi yol:QuickTran işlevini kullanın

  • Web sitemizi ziyaret edin ve çevrimiçi aracı bulun.
  • “Dosya Seç” düğmesini tıklayıp değiştirmek istediğiniz dosyayı seçerek csv dosyanızı açın.
  • Dosya yüklendikten sonra, bölmek istediğiniz “satır sayısını” girebilirsiniz. Saniyeler içinde, büyük csv"yi küçük dosyalara böleceksiniz.
  • Daha sonra dosyaları indirebilir ve bilgisayarınıza kaydedebilirsiniz.
Daha fazla Dönüşüm aracımızla tanışın
Verileri dönüştürme: Metin, Tarih/Saat, Konum, Json, vb.