[Linux] 소스코드 상에서 한글 문자열이 있는 부분만 찾아오기 Develop Tip

특정 소스에서 한글이 들어있는 파일 혹은 라인을 출력하려면
정규식을 사용하는데

".*[가-힣]+.*" 와 같이 주면 됩니다.

주의: OS X 터미널에서는 UTF-8-MAC 이라 동일한 결과가 안 나올 수 있습니다.

다음은, 파이썬 소스파일에서 한자 이상의 한글 문자열이 들어 있는 것을
모두 출력하는 것입니다.

$ find . -name "*.py" -print0 | xargs -0 egrep ".*[가-힣]+.*"
...

$ find . -name "*.py" -print0 | xargs -0 egrep -l ".*[가-힣]+.*"
...

위와 같이 egrep -l 옵션을 주면 파일 이름만 출력합니다.

또한 java 소스 파일 중에서 해당 한글이 들어가 있는 것을 찾으려면

$ find . -name "*.java" -print0 | xargs -0 egrep -l ".*[가-힣]+.*"
...

와 같이 합니다.

위에서 -print0 및 xargs -0 의 의미는
해당 블로그 를 참고하십시오.


어느분께는 도움이 되셨기를...

덧글

댓글 입력 영역

구글애드텍스트