Levenshtein distance

· Java
'Levenshtein Distance 알고리즘'과 '한글 초성, 중성, 종성 분리'에 대해서 다뤘었는데요. 이 두 내용을 결합해서 Levenshtein Distance 알고리즘에서 한글을 사용할 수 있게 변경해보려해요. 우선 Levenshtein Distance 에서 한글을 썼을 때 문제가 되는 부분은 '수정(modify)' 연산인데요. 영어 알파벳과 달리 한글은 초성, 중성, 종성으로 이루어져있기 때문이예요. '햇볕' -> '해변' 으로 수정하는 비용과 '태양' -> '기차' 로 수정하는 비용을 서로 다르게 보는거죠. 그래서 기존 Levenshtein Distance 알고리즘의 수정연산에서 한글 글자를 초성, 중성, 종성으로 분리해서 얼만큼 바꿔야하는지 비용을 계산하는 부분이 새로 추가된다고 보시면 ..
Levenshtein Distance 는 두 문자열간의 형태적 유사도를 계산하는 알고리즘이예요. 별명은 Edit Distance 로 편집 거리 알고리즘이라고도 불려요. 소련의 수학자인 Vladimir Levenshtein 이 1965년도에 고안한 알고리즘이라고 합니다. https://en.wikipedia.org/wiki/Levenshtein_distance Levenshtein distance - WikipediaFrom Wikipedia, the free encyclopedia Jump to navigation Jump to search Computer science metric for string similarity In information theory, linguistics, and comput..
_su_min
'Levenshtein distance' 태그의 글 목록