【自然言語処理】文字列の検索(Python)
文字列の検索は、データが日本語で入っている(男女など)場合もあるので使う機会が多いと思います。 一通りまとめてみました。
''' 文字列の検索(完全一致) 普通に==で可能 ''' a = '静岡県' b = '静岡県' c = '福岡県' a == b #Out[20]: True a == c Out[21]: False ''' 文字列の検索(部分一致) in を用いる ''' a = '福岡県' b = '福島県' '岡' in a #Out[27]: True '岡' in b #Out[28]: False ''' 文字列の検索(部分一致) find を用いる 引数で与えた文字列がある場合はそのインデックス(位置)を、なければ-1を返す ''' a = '福岡県' b = '福島県' a.find('岡') #Out[30]: 1 b.find('岡') #Out[31]: -1 ''' 文字列の検索(前方一致) startswith: 指定した文字列で始まるかどうかを判定 ''' a = '静岡県' b = '福岡県' a.startswith("静") #Out[35]: True b.startswith("静") #Out[36]: False ''' 文字列の検索(後方一致) startswith: 指定した文字列で始まるかどうかを判定 ''' a = '福岡県' b = '福島県' a.endswith("岡県") #Out[39]: True b.endswith("岡県") #Out[41]: False