제퍼넷 로고

Pandas에서 열 이름 바꾸기

시간

개요

Pandas에서 열 이름을 바꾸는 것은 DataFrame에서 하나 이상의 열 이름을 변경하는 프로세스를 나타냅니다. 열 이름을 바꾸면 데이터를 더 읽기 쉽고 의미 있고 일관되게 만들 수 있습니다. 우리나라에서는 매우 흔한 작업이다 데이터 조작 그리고 분석은 모두에게 알려져야 합니다. 이 기사에서는 모범 사례 및 예제와 함께 Pandas에서 열 이름을 바꾸는 데 사용되는 다양한 방법을 살펴보겠습니다.

차례

열 이름 변경의 중요성

열 이름은 다음에서 중요한 역할을 합니다. 데이터 분석 데이터에 맥락과 의미를 제공하기 때문입니다. 열 이름을 바꾸면 특히 대규모 데이터 세트로 작업할 때 코드를 더 읽기 쉽고 이해하기 쉽게 만들 수 있습니다. 또한 다양한 데이터 세트에서 일관성을 유지하는 데 도움이 되며 데이터 병합 및 조작이 더 쉬워집니다.

Python Pandas에서 열 이름 바꾸기

Python의 Pandas 라이브러리 개요

Pandas에서 열 이름을 바꾸는 방법에 대해 자세히 알아보기 전에 Python의 Pandas 라이브러리에 대해 간략하게 살펴보겠습니다. Pandas는 사용하기 쉬운 데이터 구조와 데이터 분석 도구를 제공하는 강력한 오픈 소스 데이터 조작 및 분석 라이브러리입니다. 그 위에 세워져 있으며 넘파이 라이브러리 데이터 과학 및 분석에 널리 사용됩니다.

Pandas에서 열 이름 바꾸기

Pandas는 DataFrame에서 열 이름을 바꾸는 여러 가지 방법을 제공합니다. 다음 방법 중 일부를 살펴보겠습니다.

rename() 함수 사용

Pandas의 rename() 함수를 사용하면 사전과 같은 객체나 매핑 함수를 제공하여 열 이름을 바꿀 수 있습니다. 이전 열 이름을 키로 지정하고 새 열 이름을 사전의 값으로 지정할 수 있습니다. 예는 다음과 같습니다.

예 1 :

import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df = df.rename(columns={'A': 'Column1', 'B': 'Column2'})

rename_axis() 함수 사용

Pandas의 rename_axis() 함수를 사용하면 DataFrame의 인덱스 또는 열 레이블 이름을 바꿀 수 있습니다. `columns` 매개변수를 사용하여 새 라벨을 지정할 수 있습니다. 예는 다음과 같습니다.

예 2 :

import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df = df.rename_axis(columns='NewColumn')

특정 기준에 따라 열 이름 바꾸기

경우에 따라 열 인덱스나 이름과 같은 특정 기준에 따라 열 이름을 바꾸고 싶을 수도 있습니다. Pandas는 이러한 기준에 따라 열 이름을 바꾸는 방법을 제공합니다.

인덱스별로 열 이름 바꾸기

인덱스를 기준으로 열 이름을 바꾸려면 Pandas에서 `set_axis()` 함수를 사용할 수 있습니다. 새 열 이름을 목록으로 지정하고 `axis` 매개변수를 1로 전달해야 합니다. 예는 다음과 같습니다.

예 3 :

import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df = df.set_axis(['Column1', 'Column2'], axis=1)

이름으로 열 이름 바꾸기

이름을 기준으로 열 이름을 바꾸려면 Pandas에서 'rename()' 함수를 사용할 수 있습니다. 이전 열 이름과 새 열 이름을 사전과 같은 객체로 지정해야 합니다. 예는 다음과 같습니다.

예 4 :

import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df = df.rename(columns={'A': 'Column1', 'B': 'Column2'})

사전을 사용하여 열 이름 바꾸기

Pandas를 사용하면 사전을 사용하여 열 이름을 바꿀 수도 있습니다. 이전 열 이름과 새 열 이름을 사전의 키-값 쌍으로 지정할 수 있습니다. 예는 다음과 같습니다.

예 5 :

import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df = df.rename(columns={'A': 'Column1', 'B': 'Column2'})

CSV 파일을 읽는 동안 열 이름 바꾸기

Pandas에서 열 이름을 바꾸는 또 다른 방법은 CSV 파일을 읽는 동안 열 이름을 바꾸는 것입니다. 이는 read_csv 함수의 rename 매개변수를 사용하여 수행할 수 있습니다.

예 6 :

import pandas as pd
# Read the CSV file and rename columns
df = pd.read_csv("your_file.csv", names=['NewColumn1', 'NewColumn2', 'NewColumn3'], header=None)

이 예에서 names 매개변수는 CSV 파일에 있는 이름 대신 사용될 열 이름 목록을 제공하는 데 사용됩니다. header=None 매개변수는 CSV 파일에 열 이름이 있는 헤더 행이 없음을 나타내는 데 사용됩니다.

중복된 열 이름 처리

중복된 열 이름은 혼란을 야기하고 데이터 분석에 오류를 일으킬 수 있습니다. Pandas는 중복된 열 이름을 식별하고 이름을 바꾸는 방법을 제공합니다.

중복된 열 이름 식별

DataFrame에서 중복된 열 이름을 식별하려면 Pandas에서 `duplicated()` 함수를 사용할 수 있습니다. 각 열 이름이 중복되었는지 여부를 나타내는 부울 시리즈를 반환합니다. 예는 다음과 같습니다.

예 7 :

import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'A': [7, 8, 9]})
duplicated_columns = df.columns[df.columns.duplicated()]

중복된 열 이름 이름 바꾸기

중복된 열 이름의 이름을 바꾸려면 Pandas의 `add_suffix()` 또는 `add_prefix()` 함수를 사용하여 열 이름에 접미사 또는 접두사를 추가할 수 있습니다. 예는 다음과 같습니다.

예 8 :

import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'A': [7, 8, 9]})
df = df.add_suffix('_duplicate')

예시 및 사용 사례

Pandas에서 열 이름을 바꾸는 방법을 이해하기 위해 몇 가지 예와 사용 사례를 살펴보겠습니다.

Pandas DataFrame에서 열 이름 바꾸기

예 9 :

import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df = df.rename(columns={'A': 'Column1', 'B': 'Column2'})

MultiIndex DataFrame의 열 이름 바꾸기

예 10 :

import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df.columns = pd.MultiIndex.from_tuples([('Column1', 'SubColumn1'), ('Column2', 'SubColumn2')])

결론

Pandas에서 열 이름을 바꾸는 것은 데이터 조작 및 분석에서 중요한 단계입니다. 이 문서에 설명된 방법과 사례를 따르면 Pandas DataFrame에서 열 이름을 효과적으로 바꿀 수 있습니다. 설명적이고 일관된 이름을 선택하고, 예약된 키워드와 특수 문자를 피하고, 중복된 열 이름을 적절하게 처리해야 합니다. 즐거운 코딩하세요!

spot_img

최신 인텔리전스

spot_img