¿Cómo dividir un archivo csv en varios archivos pequeños?
Introducción
Divida fácilmente un csv grande en archivos pequeños sin fórmula y cada archivo de salida contiene datos del mismo número de filas . Solo cargue un archivo csv, obtenga resultados en segundos. Procesamiento eficiente y sin esfuerzo: ¡pruébelo ahora!
Cómo dividir un archivo csv en varios archivos pequeños
Dividir un archivo grande en archivos pequeños no es una cuestión muy sencilla. Por ejemplo, nos encontraremos con muchos escenarios como este en el trabajo, es posible que tengamos un archivo csv que guarde los datos del pedido y que contenga millones de líneas. Necesitamos poner esto. El archivo está dividido en varios archivos csv de tamaño similar. ¿Cómo podemos hacerlo? Siga estos pasos y guías para obtener más información sobre nuestro producto y cómo usarlo de manera eficaz.
Hay varias formas de dividir un archivo CSV o Excel grande en archivos más pequeños:
- Uso de Excel: abra el archivo grande en Excel, ordene los datos de la columna que desee usar para dividir los datos y, a continuación, seleccione y copie los datos de cada archivo más pequeño y péguelos en un nuevo libro de trabajo. Guarde cada libro nuevo como un archivo independiente.
- Uso de un lenguaje de secuencias de comandos como Python: utilice la biblioteca pandas para leer el archivo grande y, a continuación, utilice los métodos de pandas para dividir los datos en marcos de datos más pequeños y, finalmente, escriba cada marco de datos en un archivo CSV independiente.
- Uso de una herramienta de gestión de datos como SQL: importe el archivo grande a una base de datos y, a continuación, utilice consultas SQL para dividir los datos en tablas más pequeñas y exportar cada tabla como un archivo CSV independiente.
- Uso de una herramienta de línea de comandos, como dividir: si el archivo grande es un archivo de texto sin formato (CSV), puedes dividirlo en archivos más pequeños mediante el comando «dividir» en una terminal. Por ejemplo, «split -l 20000 largefile.csv splitfile_» dividirá el largefile.csv en varios archivos, cada uno con 20000 líneas, con nombres como splitfile_aa, splitfile_ab, etc.
Si puedes usar Python, puedes dividir el archivo csv grande en archivos pequeños:
Este es un ejemplo de código Python que utiliza la biblioteca pandas para dividir un archivo CSV grande en archivos más pequeños según una columna específica:
import pandas as pd
# read the large csv file into a pandas dataframe
df = pd.read_csv('largefile.csv')
# get the unique values of the column you want to split the data by
column_values = df[column_name].unique()
# loop over the unique values of the column
for value in column_values:
# create a dataframe for each unique value
value_df = df[df[column_name] == value]
# write the dataframe to a new csv file
value_df.to_csv(f'{column_name}_{value}.csv', index=False)
La mejor manera: utilice la función QuickTran
- Visite nuestro sitio web y busque la herramienta en línea.
- Abre tu archivo csv haciendo clic en el botón «Elegir archivo» y seleccionando el archivo que deseas cambiar.
- Una vez cargado el archivo, puedes introducir los números en los que quieres dividirlo. En segundos, dividirás el archivo CSV grande en archivos pequeños.
- A continuación, puede descargar los archivos y guardarlos en su ordenador.