文字列同士のレーベンシュタイン距離(編集距離)を計算してくれるライブラリがあります。
とりあえずインストールしてみました。
1 | pip install python-levenshtein |
1 2 3 | >>> import Levenshtein >>> Levenshtein.distance('Levenshtein', 'Lenvinsten') 4 |
レーベンシュタイン距離(編集距離)は4です。
1 2 | >>> Levenshtein.distance('ほげほげ', 'ほげほげ') 0 |
レーベンシュタイン距離(編集距離)は0です。
1 2 | >>> Levenshtein.distance('ほげほげa', 'ほげほげ') 1 |
半角文字を1文字追加した場合のレーベンシュタイン距離(編集距離)は1です。
1 2 | >>> Levenshtein.distance('ほげほげほ', 'ほげほげ') 2 |
全角文字を1文字追加した場合のレーベンシュタイン距離(編集距離)は2です。