개요
Pandas에서 열 이름을 바꾸는 것은 DataFrame에서 하나 이상의 열 이름을 변경하는 프로세스를 나타냅니다. 열 이름을 바꾸면 데이터를 더 읽기 쉽고 의미 있고 일관되게 만들 수 있습니다. 우리나라에서는 매우 흔한 작업이다 데이터 조작 그리고 분석은 모두에게 알려져야 합니다. 이 기사에서는 모범 사례 및 예제와 함께 Pandas에서 열 이름을 바꾸는 데 사용되는 다양한 방법을 살펴보겠습니다.
차례
열 이름 변경의 중요성
열 이름은 다음에서 중요한 역할을 합니다. 데이터 분석 데이터에 맥락과 의미를 제공하기 때문입니다. 열 이름을 바꾸면 특히 대규모 데이터 세트로 작업할 때 코드를 더 읽기 쉽고 이해하기 쉽게 만들 수 있습니다. 또한 다양한 데이터 세트에서 일관성을 유지하는 데 도움이 되며 데이터 병합 및 조작이 더 쉬워집니다.
Python의 Pandas 라이브러리 개요
Pandas에서 열 이름을 바꾸는 방법에 대해 자세히 알아보기 전에 Python의 Pandas 라이브러리에 대해 간략하게 살펴보겠습니다. Pandas는 사용하기 쉬운 데이터 구조와 데이터 분석 도구를 제공하는 강력한 오픈 소스 데이터 조작 및 분석 라이브러리입니다. 그 위에 세워져 있으며 넘파이 라이브러리 데이터 과학 및 분석에 널리 사용됩니다.
Pandas에서 열 이름 바꾸기
Pandas는 DataFrame에서 열 이름을 바꾸는 여러 가지 방법을 제공합니다. 다음 방법 중 일부를 살펴보겠습니다.
rename() 함수 사용
Pandas의 rename() 함수를 사용하면 사전과 같은 객체나 매핑 함수를 제공하여 열 이름을 바꿀 수 있습니다. 이전 열 이름을 키로 지정하고 새 열 이름을 사전의 값으로 지정할 수 있습니다. 예는 다음과 같습니다.
예 1 :
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df = df.rename(columns={'A': 'Column1', 'B': 'Column2'})
rename_axis() 함수 사용
Pandas의 rename_axis() 함수를 사용하면 DataFrame의 인덱스 또는 열 레이블 이름을 바꿀 수 있습니다. `columns` 매개변수를 사용하여 새 라벨을 지정할 수 있습니다. 예는 다음과 같습니다.
예 2 :
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df = df.rename_axis(columns='NewColumn')
특정 기준에 따라 열 이름 바꾸기
경우에 따라 열 인덱스나 이름과 같은 특정 기준에 따라 열 이름을 바꾸고 싶을 수도 있습니다. Pandas는 이러한 기준에 따라 열 이름을 바꾸는 방법을 제공합니다.
인덱스별로 열 이름 바꾸기
인덱스를 기준으로 열 이름을 바꾸려면 Pandas에서 `set_axis()` 함수를 사용할 수 있습니다. 새 열 이름을 목록으로 지정하고 `axis` 매개변수를 1로 전달해야 합니다. 예는 다음과 같습니다.
예 3 :
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df = df.set_axis(['Column1', 'Column2'], axis=1)
이름으로 열 이름 바꾸기
이름을 기준으로 열 이름을 바꾸려면 Pandas에서 'rename()' 함수를 사용할 수 있습니다. 이전 열 이름과 새 열 이름을 사전과 같은 객체로 지정해야 합니다. 예는 다음과 같습니다.
예 4 :
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df = df.rename(columns={'A': 'Column1', 'B': 'Column2'})
사전을 사용하여 열 이름 바꾸기
Pandas를 사용하면 사전을 사용하여 열 이름을 바꿀 수도 있습니다. 이전 열 이름과 새 열 이름을 사전의 키-값 쌍으로 지정할 수 있습니다. 예는 다음과 같습니다.
예 5 :
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df = df.rename(columns={'A': 'Column1', 'B': 'Column2'})
CSV 파일을 읽는 동안 열 이름 바꾸기
Pandas에서 열 이름을 바꾸는 또 다른 방법은 CSV 파일을 읽는 동안 열 이름을 바꾸는 것입니다. 이는 read_csv 함수의 rename 매개변수를 사용하여 수행할 수 있습니다.
예 6 :
import pandas as pd
# Read the CSV file and rename columns
df = pd.read_csv("your_file.csv", names=['NewColumn1', 'NewColumn2', 'NewColumn3'], header=None)
이 예에서 names 매개변수는 CSV 파일에 있는 이름 대신 사용될 열 이름 목록을 제공하는 데 사용됩니다. header=None 매개변수는 CSV 파일에 열 이름이 있는 헤더 행이 없음을 나타내는 데 사용됩니다.
중복된 열 이름 처리
중복된 열 이름은 혼란을 야기하고 데이터 분석에 오류를 일으킬 수 있습니다. Pandas는 중복된 열 이름을 식별하고 이름을 바꾸는 방법을 제공합니다.
중복된 열 이름 식별
DataFrame에서 중복된 열 이름을 식별하려면 Pandas에서 `duplicated()` 함수를 사용할 수 있습니다. 각 열 이름이 중복되었는지 여부를 나타내는 부울 시리즈를 반환합니다. 예는 다음과 같습니다.
예 7 :
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'A': [7, 8, 9]})
duplicated_columns = df.columns[df.columns.duplicated()]
중복된 열 이름 이름 바꾸기
중복된 열 이름의 이름을 바꾸려면 Pandas의 `add_suffix()` 또는 `add_prefix()` 함수를 사용하여 열 이름에 접미사 또는 접두사를 추가할 수 있습니다. 예는 다음과 같습니다.
예 8 :
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'A': [7, 8, 9]})
df = df.add_suffix('_duplicate')
예시 및 사용 사례
Pandas에서 열 이름을 바꾸는 방법을 이해하기 위해 몇 가지 예와 사용 사례를 살펴보겠습니다.
Pandas DataFrame에서 열 이름 바꾸기
예 9 :
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df = df.rename(columns={'A': 'Column1', 'B': 'Column2'})
MultiIndex DataFrame의 열 이름 바꾸기
예 10 :
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df.columns = pd.MultiIndex.from_tuples([('Column1', 'SubColumn1'), ('Column2', 'SubColumn2')])
결론
Pandas에서 열 이름을 바꾸는 것은 데이터 조작 및 분석에서 중요한 단계입니다. 이 문서에 설명된 방법과 사례를 따르면 Pandas DataFrame에서 열 이름을 효과적으로 바꿀 수 있습니다. 설명적이고 일관된 이름을 선택하고, 예약된 키워드와 특수 문자를 피하고, 중복된 열 이름을 적절하게 처리해야 합니다. 즐거운 코딩하세요!
관련
- SEO 기반 콘텐츠 및 PR 배포. 오늘 증폭하십시오.
- PlatoData.Network 수직 생성 Ai. 자신에게 권한을 부여하십시오. 여기에서 액세스하십시오.
- PlatoAiStream. 웹3 인텔리전스. 지식 증폭. 여기에서 액세스하십시오.
- 플라톤ESG. 탄소, 클린테크, 에너지, 환경, 태양광, 폐기물 관리. 여기에서 액세스하십시오.
- PlatoHealth. 생명 공학 및 임상 시험 인텔리전스. 여기에서 액세스하십시오.
- 출처: https://www.analyticsvidhya.com/blog/2023/12/renaming-column-names-in-pandas/