スキルUPの道しるべ

本サイトはプロモーションを含みます
上に戻る

【Python】splitを使って複数の区切り文字で文字列を分割する方法

Pythonには文字列を分割するための強力なメソッドとしてsplitがあります。 しかし、標準のsplitメソッドは単一の区切り文字しかサポートしていません。 複数の区切り文字で文字列を分割するにはどうすればよいのでしょうか?

そこで、この記事では、その方法について詳しく解説します。コード例も豊富に取り入れて、視覚的にもわかりやすく説明します。

splitメソッドの基本

まずは、Pythonの標準のsplitメソッドについて簡単におさらいしましょう。

splitメソッドの基本的な使い方

以下のコード例は、スペースで文字列を分割する基本的な例です。

text = "Python is fun"
result = text.split()
print(result)

実行結果:

['Python', 'is', 'fun']

このように、標準のsplitメソッドは指定された区切り文字(デフォルトではスペース)で文字列を分割します。

複数の区切り文字で分割する方法

複数の区切り文字を使って文字列を分割するためには、いくつかの方法があります。以下にその代表的な方法を紹介します。

1. 正規表現を使う方法

正規表現を使うと、複数の区切り文字を指定して文字列を分割することができます。reモジュールを使って実現します。

import re

text = "Python,is fun; and versatile"
pattern = r'[ ,;]'
result = re.split(pattern, text)
print(result)

実行結果:

['Python', 'is', 'fun', 'and', 'versatile']

この例では、スペース、カンマ、セミコロンを区切り文字として使用しています。re.splitを使うことで、これらの区切り文字のいずれかが現れたら文字列を分割します。

2. 連続した区切り文字を処理する方法

上記の方法では、連続した区切り文字が含まれる場合に、空の要素が結果に含まれてしまうことがあります。この問題を回避するための方法を紹介します。

import re

text = "Python,,is fun;; and versatile"
pattern = r'[ ,;]+'
result = re.split(pattern, text)
print(result)

実行結果:

['Python', 'is', 'fun', 'and', 'versatile']

この例では、正規表現の最後に+を追加することで、連続する区切り文字を一つにまとめて扱うことができます。

3. 複数の区切り文字を含む場合の詳細な例

もう少し複雑な例を見てみましょう。複数の異なる区切り文字を使って、詳細な分割を行います。

import re

text = "Python:is,fun;and|versatile"
pattern = r'[:;,|]'
result = re.split(pattern, text)
print(result)

実行結果:

['Python', 'is', 'fun', 'and', 'versatile']

この例では、コロン、カンマ、セミコロン、パイプを区切り文字として指定しています。これにより、これらのいずれかが現れた時に文字列が分割されます。

splitメソッドのカスタム関数を作る

正規表現以外にも、Pythonの機能を使ってカスタム関数を作成することで、複数の区切り文字で文字列を分割することも可能です。

例: カスタム分割関数の作成
def custom_split(text, delimiters):
    import re
    pattern = '|'.join(map(re.escape, delimiters))
    return re.split(pattern, text)

text = "Python:is,fun;and|versatile"
delimiters = [':', ',', ';', '|']
result = custom_split(text, delimiters)
print(result)

実行結果:

['Python', 'is', 'fun', 'and', 'versatile']

この関数では、リストで複数の区切り文字を渡し、それらを正規表現パターンに変換してre.splitで分割しています。

関連・おすすめ書籍

おすすめ書籍:

まとめ

Pythonで文字列を分割する際に、複数の区切り文字を使いたい場合、正規表現を使うのが最も一般的で柔軟な方法です。 また、カスタム関数を作成することで、特定のニーズに合わせた文字列分割も簡単に実現できます。

▼必見(ChatGPTを活用!おすすめAI副業)▼

今なら5000円分の特典あり!! dodgsonblog.com