Cómo extraer columnas de un archivo CSV

Extraer columnas de un archivo CSV en línea

La herramienta es una herramienta en línea simple pero potente que le permite extraer una o más columnas específicas de un archivo CSV y guardarlas en un archivo CSV independiente. Esta herramienta puede resultar extremadamente útil si tienes un archivo CSV grande con muchas columnas y solo necesitas trabajar con un subconjunto de ellas.

Para usar la herramienta, simplemente cargue su archivo CSV y especifique las columnas que desea extraer. A continuación, la herramienta procesará el archivo de entrada y creará un nuevo archivo CSV con solo las columnas especificadas. A continuación, puede descargar el archivo de salida y utilizarlo para un análisis más detallado.

extraer columnas del archivo.csv

¿Cómo extraer columnas de un archivo CSV usando Python?

Python es un lenguaje de programación popular que se utiliza a menudo para tareas de análisis y manipulación de datos. Una tarea habitual es extraer columnas específicas de un archivo CSV. Afortunadamente, Python ofrece varias bibliotecas que hacen que esta tarea sea fácil y directa.

Una de esas bibliotecas es la pandas biblioteca, que ofrece un leer_csv () función que puede leer un archivo CSV en un Marco de datos objeto. Una vez que el archivo CSV se haya cargado en un Marco de datos , puede utilizar la indexación para extraer columnas específicas por nombre o posición. Por ejemplo, puede utilizar el iLoc [1] método para extraer columnas por sus posiciones en el índice.

Este es un ejemplo de fragmento de código que muestra cómo extraer columnas específicas de un archivo CSV usando pandas :


import pandas as pd

# Load the CSV file into a DataFrame
df = pd.read_csv('input.csv')

# Extract the 'column1' and 'column3' columns
new_df = df.iloc[:, [0, 2]]

# Save the extracted columns to a new CSV file
new_df.to_csv('output.csv', index=False)

En este ejemplo, primero cargamos el archivo CSV de entrada usando pd.read_csv () . Luego usamos iLoc [1] para extraer la primera y la tercera columna ( [0, 2] ) y asigne el resultado a un nuevo Marco de datos llamado nuevo_df . Por último, guardamos las columnas extraídas en un nuevo archivo CSV usando para_csv () .

En general, utilizando pandas extraer columnas específicas de un archivo CSV es un enfoque simple y eficaz. Esta biblioteca ofrece muchas otras funciones y características útiles para el análisis de datos, lo que la convierte en una herramienta valiosa para cualquier científico o analista de datos.

Conozca más de nuestras herramientas de transformación
Transforma datos: texto, fecha/hora, ubicación, Json, etc.