概要
Pandas での列名の変更とは、DataFrame 内の XNUMX つ以上の列の名前を変更するプロセスを指します。列の名前を変更することで、データをより読みやすく、意味があり、一貫性のあるものにすることができます。それは非常に一般的なタスクです データ操作 そして分析などはすべての人に知られていなければなりません。この記事では、Pandas で列の名前を変更するために使用されるさまざまな方法と、ベスト プラクティスおよび例について説明します。
目次
列名の変更の重要性
列名は重要な役割を果たします データ分析 データにコンテキストと意味を提供するためです。列名を変更すると、特に大規模なデータセットを扱う場合に、コードがより読みやすく理解しやすくなります。また、異なるデータセット間で一貫性を維持するのにも役立ち、データの結合と操作が容易になります。
Python の Pandas ライブラリの概要
Pandas での列名の変更の詳細に入る前に、Python の Pandas ライブラリの概要を簡単に理解しましょう。 Pandas は、使いやすいデータ構造とデータ分析ツールを提供する、強力なオープンソースのデータ操作および分析ライブラリです。の上に建てられています NumPy ライブラリ データサイエンスと分析で広く使用されています。
Pandas での列の名前変更
Pandas には、DataFrame 内の列名を変更するためのメソッドがいくつか用意されています。これらの方法のいくつかを見てみましょう。
rename() 関数の使用
Pandas の rename() 関数を使用すると、辞書のようなオブジェクトまたはマッピング関数を提供することで列名を変更できます。ディクショナリ内のキーとして古い列名を指定し、値として新しい列名を指定できます。以下に例を示します。
例1:
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df = df.rename(columns={'A': 'Column1', 'B': 'Column2'})
rename_axis() 関数の使用
Pandas の rename_axis() 関数を使用すると、DataFrame のインデックスまたは列ラベルの名前を変更できます。 `columns` パラメータを使用して新しいラベルを指定できます。以下に例を示します。
例2:
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df = df.rename_axis(columns='NewColumn')
特定の基準に基づいて列の名前を変更する
場合によっては、列のインデックスや名前など、特定の基準に基づいて列の名前を変更したい場合があります。 Pandas は、これらの基準に基づいて列の名前を変更するメソッドを提供します。
インデックスによる列名の変更
インデックスに基づいて列の名前を変更するには、Pandas の `set_axis()` 関数を使用できます。新しい列名をリストとして指定し、`axis` パラメーターを 1 として渡す必要があります。例を次に示します。
例3:
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df = df.set_axis(['Column1', 'Column2'], axis=1)
列の名前を名前で変更する
名前に基づいて列の名前を変更するには、Pandas の `rename()` 関数を使用できます。新旧の列名を辞書のようなオブジェクトとして指定する必要があります。以下に例を示します。
例4:
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df = df.rename(columns={'A': 'Column1', 'B': 'Column2'})
辞書を使用した列の名前変更
Pandas では、辞書を使用して列の名前を変更することもできます。ディクショナリ内のキーと値のペアとして古い列名と新しい列名を指定できます。以下に例を示します。
例5:
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df = df.rename(columns={'A': 'Column1', 'B': 'Column2'})
CSV ファイルの読み取り中に列の名前を変更する
Pandas で列の名前を変更するもう XNUMX つの方法には、CSV ファイルの読み取り中に列の名前を変更することが含まれます。これは、read_csv 関数の名前変更パラメータを使用して実行できます。
例6:
import pandas as pd
# Read the CSV file and rename columns
df = pd.read_csv("your_file.csv", names=['NewColumn1', 'NewColumn2', 'NewColumn3'], header=None)
この例では、names パラメーターを使用して、CSV ファイルに存在する名前の代わりに使用される列名のリストを提供します。 header=None パラメーターは、CSV ファイルに列名を含むヘッダー行がないことを示すために使用されます。
重複する列名の処理
列名が重複すると混乱が生じ、データ分析でエラーが発生する可能性があります。 Pandas は、重複する列名を特定して名前を変更するメソッドを提供します。
重複する列名の特定
DataFrame 内の重複する列名を識別するには、Pandas の `duplicated()` 関数を使用できます。各列名が重複しているかどうかを示すブール値の Series を返します。以下に例を示します。
例7:
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'A': [7, 8, 9]})
duplicated_columns = df.columns[df.columns.duplicated()]
重複する列名の変更
重複した列名を変更するには、Pandas の `add_suffix()` または `add_prefix()` 関数を使用して列名にサフィックスまたはプレフィックスを追加します。以下に例を示します。
例8:
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'A': [7, 8, 9]})
df = df.add_suffix('_duplicate')
例と使用例
Pandas で列名を変更する方法を理解するために、いくつかの例とユースケースを見てみましょう。
Pandas DataFrame の列の名前を変更する
例9:
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df = df.rename(columns={'A': 'Column1', 'B': 'Column2'})
MultiIndex DataFrame の列の名前変更
例10:
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df.columns = pd.MultiIndex.from_tuples([('Column1', 'SubColumn1'), ('Column2', 'SubColumn2')])
まとめ
Pandas での列名の変更は、データ操作と分析における重要な手順です。この記事で説明した方法と実践に従うことで、Pandas DataFrame の列名を効果的に変更できます。説明的で一貫性のある名前を選択し、予約されたキーワードや特殊文字を避け、重複する列名を適切に処理するようにしてください。コーディングを楽しんでください!
関連記事
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- 情報源: https://www.analyticsvidhya.com/blog/2023/12/renaming-column-names-in-pandas/