いっかくのデータサイエンティストをいく

1からプログラミングとデータサイエンスを独習したい

【自然言語処理】文字列の削除・置換(Python)

Pythonで文字列の一部を置き換えたり(置換)、削除を行う方法をまとめました。

'''
特定の文字を削除する
→空文字に置換
'''
test = '大阪府'
test.replace('府', '')
#Out[1]: '大阪'


'''
先頭・末尾から〇文字削除する
'''
test = '東京都葛飾区柴又'
test[3:6]
#Out[3]: '葛飾区'


'''
両端の空白削除
'''
s = ' VS '
'大阪府' + s.strip()  + '京都府' #両端削除
#Out[5]: '大阪府VS京都府'  
'大阪府' + s.lstrip() + '京都府' #左端削除
#Out[6]: '大阪府VS 京都府'
'大阪府' + s.rstrip() + '京都府' #右端削除
#Out[7]: '大阪府 VS京都府'


'''
文字の置換
'''
test = '佐賀県'
#replaceを使う方法
test.replace('佐', '滋')
#Out[8]: '滋賀県'

#re.subを使う方法
import re
re.sub('佐', '滋', test)
#Out[9]: '滋賀県'


'''
全部大文字にする
'''
'hello'.upper()
#Out[10]: 'HELLO'


'''
全部小文字にする
'''
'HELLO'.lower()
#Out[11]: 'hello'


'''
半角にする
'''
import zenhan
zenhan.z2h(u'アイウabc012')
#Out[15]: 'アイウabc012'