본문 바로가기
분석데이터

국립국어원 세종 말뭉치(sejong-corpus) 다운로드 스크립트( 최호진 (Hojin Choi))

by 기서무나구물 2018. 12. 21.

포스팅 목차

    국립국어원 세종 말뭉치(sejong-corpus) 다운로드 스크립트( 최호진 (Hojin Choi))

     
    * 스크립트 제작 이유
    - 세종 말뭉치 관련 파일들이 1400개가 넘습니다. 또한 전체 크기는 2GB에 해당.
    - 게시판을 통해 하나씩 받는데 어려움이 있습니다.
    - 말뭉치에 사소한 오류들이 있습니다. 또한, 세종 말뭉치는 개작 및 재배포를 허용하지 않는 라이센스를 가지고 있습니다. 따라서, 연구자들이 말뭉치를 받아 오류를 고쳐도 재배포가 허용되지 않습니다.
     
     
    ******************************************************
    - 통계분석연구회
    - 카페 : http://cafe.daum.net/statsas
    - 통계분석연구회(Statistics Analysis Study) 그룹
    : https://www.facebook.com/groups/statsas
    - STATWITH : http://statwith.tistory.com/
    - RSS : https://statwith.tistory.com/rss

     

    반응형

    댓글