いっかくのデータサイエンティストをいく

1からプログラミングとデータサイエンスを独習したい

【自然言語処理】文字列の検索(Python)

文字列の検索は、データが日本語で入っている(男女など)場合もあるので使う機会が多いと思います。 一通りまとめてみました。

'''
文字列の検索(完全一致)
 普通に==で可能
'''
a = '静岡県'
b = '静岡県'
c = '福岡県'

a == b
#Out[20]: True
a == c
Out[21]: False


'''
文字列の検索(部分一致)
 in を用いる
'''
a = '福岡県'
b = '福島県'

'岡' in a
#Out[27]: True
'岡' in b
#Out[28]: False


'''
文字列の検索(部分一致)
 find を用いる
     引数で与えた文字列がある場合はそのインデックス(位置)を、なければ-1を返す
'''
a = '福岡県'
b = '福島県'

a.find('岡')
#Out[30]: 1
b.find('岡')
#Out[31]: -1


'''
文字列の検索(前方一致)
 startswith: 指定した文字列で始まるかどうかを判定
'''
a = '静岡県'
b = '福岡県'

a.startswith("静")
#Out[35]: True
b.startswith("静")
#Out[36]: False


'''
文字列の検索(後方一致)
 startswith: 指定した文字列で始まるかどうかを判定
'''
a = '福岡県'
b = '福島県'

a.endswith("岡県")
#Out[39]: True
b.endswith("岡県")
#Out[41]: False