So extrahieren Sie Spalten aus einer CSV-Datei
Das Tool ist ein einfaches und dennoch leistungsstarkes Online-Tool, mit dem Sie eine oder mehrere bestimmte Spalten aus einer CSV-Datei extrahieren und in einer separaten CSV-Datei speichern können. Dieses Tool kann äußerst nützlich sein, wenn Sie eine große CSV-Datei mit vielen Spalten haben und nur mit einer Teilmenge davon arbeiten müssen.
Um das Tool zu verwenden, laden Sie einfach Ihre CSV-Datei hoch und geben Sie die Spalten an, die Sie extrahieren möchten. Das Tool verarbeitet dann die Eingabedatei und erstellt eine neue CSV-Datei mit nur den angegebenen Spalten. Sie können dann die Ausgabedatei herunterladen und für weitere Analysen verwenden.
Extrahieren Sie Spalten aus einer CSV-Datei
Wie extrahiere ich Spalten aus einer CSV-Datei mit Python?
Python ist eine beliebte Programmiersprache, die häufig für Datenanalyse- und Manipulationsaufgaben verwendet wird. Eine häufige Aufgabe ist das Extrahieren bestimmter Spalten aus einer CSV-Datei. Zum Glück bietet Python mehrere Bibliotheken, die diese Aufgabe einfach und unkompliziert machen.
Eine solche Bibliothek ist die Pandas Bibliothek, die eine bereitstellt lesen_csv () Funktion, die eine CSV-Datei in eine einlesen kann Datenrahmen Objekt. Sobald die CSV-Datei in eine geladen ist Datenrahmen , Sie können die Indizierung verwenden, um bestimmte Spalten nach Namen oder Position zu extrahieren. Sie können zum Beispiel den verwenden Iloc [1] Methode zum Extrahieren von Spalten nach ihren Indexpositionen.
Hier ist ein Beispielcodeausschnitt, der zeigt, wie bestimmte Spalten aus einer CSV-Datei extrahiert werden, indem Pandas :
import pandas as pd
# Load the CSV file into a DataFrame
df = pd.read_csv('input.csv')
# Extract the 'column1' and 'column3' columns
new_df = df.iloc[:, [0, 2]]
# Save the extracted columns to a new CSV file
new_df.to_csv('output.csv', index=False)
In diesem Beispiel laden wir zuerst die CSV-Eingabedatei mit pd.read_csv () . Wir verwenden dann Iloc [1] um die erste und dritte Spalte zu extrahieren ( [0, 2] ) und weisen Sie das Ergebnis einem neuen zu Datenrahmen genannt neu_df . Schließlich speichern wir die extrahierten Spalten in einer neuen CSV-Datei mit zu_csv () .
Insgesamt unter Verwendung Pandas das Extrahieren bestimmter Spalten aus einer CSV-Datei ist ein einfacher und effektiver Ansatz. Diese Bibliothek bietet viele weitere nützliche Funktionen und Merkmale für die Datenanalyse und ist somit ein wertvolles Werkzeug für jeden Datenwissenschaftler oder Analysten.