본문 바로가기
분석데이터

한국의 욕설 사전 리스트

by 기서무나구물 2021. 12. 1.

포스팅 목차

    한국의 욕설 사전 리스트

     

    욕설 사전 제작을 위한 참고 자료
    욕설 사전을 제작하시는 분의 글을 보고서 과거에 정리한 자료를 공유합니다.


    ***********************


    예전에 욕설사전 제작하려고 찾았던 기억이 나네요. 단어매칭으로 처리하려다 보니 년도(숫자) 처리가 문제였던 기억도.
    "봉알선생의 우리 욕 기행" 영상을 탐독하며 새로운 욕을 많이 배웠는데. 우리말 욕은 하도 다양하고 변화무쌍하여서 놀랍기 그지 없어서 감탄을 하였습니다^^


    글 보실 때는 후방 조심히 보시기를 주의 부탁 드리며 자료 링크 공유합니다.
    과거 자료여서 최신 신조어를 추가 하셔야합니다.


    국어 비속어 사전 (강남대 김동언 교수)

     

    책소개

    문학 작품 및 실생활에서 쓰이고 있는 비속어를 구체적인 용례와 함께 일목요연하게 집대성한 본격 비속어 사전으로, 총 1,100페이지 분량의 '머리말/사전을 펴내며/일러두기/본문/부록(존아어/품사별목록/의미별 목록/외래어 목록/참고 문헌/용례 문헌)'으로 구성되어 있으며, 수록된 표제어만도 무려 8천여 개에 달하는 현존하는 최고의 비속어 사전.

     

    출판사 리뷰

    벌거벗은 말인 비속어를 모아 실체를 확인하고 우리가 어떤 종류의 비속어를 많이 쓰고 있으며, 그 특징이 무엇인지를 안다는 것은 한국인의 진솔한 정서를 이해하는 데 중요한 토대가 된다. 지금까지 비속어를 정리하는 작업이 전혀 없었던 것은 아니나, 그들은 사전의 종합화와 정밀화라는 점에서 아쉬운 점이 많았다. 그에 비해 <국어 비속어 사전>은 사전의 체제를 정식으로 갖춘 '국내 최초의 본격적인 비속어 사전'이라는 점에서 의의를 찾을 수 있다.

    본 <국어 비속어 사전>에 인용된 자료들을 보면 몇 가지 재미있는 사항을 뽑아 낼 수 있는데, 간단히 정리하면, 비속어를 가장 많이 구사하는 소설가는 이문구, 비속어가 가장 많이 나오는 소설은 < 객주 >, 비속어 중 가장 많은 외래어는 일어, 비속어에 가장 많은 품사는 명사, 비속어에 가장 많이 관계되는 것은 욕설이었다.

     


    한국의 욕설백과 [링크]

     

    "한국의 욕설백과" 책소개 : 

    욕 잘하는 사람이 말도 잘한다. 욕, 은어, 비어, 속어, 상소리 속담. 우리 조상들의 질펀한 해학이 묻어 있는 욕설에서부터 현재 젊은이들 사이에 통용되고 있는 은어. 비어까지 저자가 전국을 누비며 취재한 3,000여 항목의 욕설 모음집. 한국의 욕설을 내용별로 분류하고 그 어원과 뜻을 풀이한 상소리 백과이다.
     

    목차

    1. 성 관련 욕설
    2. 성별 또는 직분 관련 욕설
    3. 동. 식물 관련 욕설
    4. 사물 또는 현상 관련 욕설
    5. 삶을 해학적으로 풍자한 욕설
    6. 잘못된 성정을 탓하는 욕설
    7. 돌출 상황에 대응하는 말들
    8. 그외 말맛 좋은 욕설

     
     

     


    나무위키 "욕설" [링크]

     

    나무 위키 개요

    욕은 언어의 요소 가운데 하나로, 시대에 따라 단어의 강세나 의미가 바뀔 수 있기에 나무위키에 기록할 때 주의를 요한다. 예를 들어 '바보'라는 단어는 80년대까지만 해도 어엿이 욕이었지만 90년대에 들어가면서 바보라는 말은 강도가 매우 낮아졌다. 이 문서에 적혀있는 단어들이 전부 욕설은 아니고, 욕설로 쓰였었거나 쓰일 수 있는 말들도 일부 작성되어 있다.

     


    나무위키 "욕설"(영어) [링크]

     

    나무위키 개요

    일부 성적인 단어 및 욕설의 결합은 쓰임에 따라 '매우 강한' 욕설이 될 수 있으니 주의하기 바란다. 또한 상황에 따라 뉘앙스나 의도가 변하는 것이 욕의 특성이라는 것도 유의하자.

    한국어가 가장 욕이 다채롭다는 사람들이 많은데, 이건 착각이다. 된소리가 발달하여 더 차지고 강해보이는 건 사실이지만, 실제로 욕설의 다양성에서는 영어가 한국어를 능가한다. 특히 인종, 민족 관련 욕은 한국어로 감히 따라갈 수 없다.

     


    한국의 욕설(無我 , pjj321.egloos.com/) [링크]

    • 기타 말맛 좋은 관련 욕설
    • 기쁨과 칭찬 관련 욕설
    • 말과 소리 관련 욕설
    • 맛과 음식 관련 욕설
    • 그 외 상황 대응 관련 욕설
    • 저주와 협박 관련 욕설
    • 책망과 비아냥 관련 욕설
    • 당황 관련 욕설
    • 체념과 하소연 관련 욕설
    • 그 외 잘못을 탓하는 욕설
    • 고집, 변덕, 심술 관련 욕설
    • 조급함과 게으름 관련 욕설
    • 무능함과 어리석음 관련 욕설
    • 욕심과 몰염치 관련 욕설
    • 사나움과 지독함 관련 욕설
    • 종교 관련 욕설
    • 길흉화복, 부귀빈천 관련 욕설
    • 생로병사 관련 욕설
    • 세상살이 관련 욕설
    • 귀신, 도깨비 관련 욕설
    • 신체 관련 욕설
    • 술 관련 욕설
    • 돈 관련 욕설
    • 식물 관련 욕설
    • 그외 동물 관련 욕설
    • 개 관련 욕설
    • 부모와 자녀, 형제 관련 욕설
    • 부부와 첩 관련 욕설
    • 시어머니와 시아버지 관련 욕설
    • 과부와 홀아비 관련 욕설
    • 처녀, 총각 관련 욕설
    • 남성 관련 욕설
    • 여성 관련 욕설
    • 바람기 관련 욕설
    • 사랑과 정 관련 욕설

     


    한국 욕에 대한 보고서 (2003.06.06, 장종희) - 순수 한글 욕설 모음,욕,쌍소리 [링크]

     

    1. 序論(서론) 일부

     

    이 글의 草案(초안)은 본인이 1년 전에 결성했던 “辱友會(욕우회)”의 창단 취지에서 비롯한 것임을 밝히며, 현재 욕우회는 유명무실 그 뜻을 제대로 살리지 못하고 있음을 아울러 添言(첨언)한다. 그리고, 한가지 당부하고 싶은 말은 이 글에서 다루어지지 않았거나 새로운 욕이라고 생각되는 것을 들었을 경우 그 욕을 Hitel I.D copycom 으로 mail을 통해서 해주기 바란다. 욕, 모르고 함부로 하는 것 보다는 정확히 알고 하지 않는 것이 인생에 도움이 되지 않겠는가?

     

    차례

    1. 序論(서론)
    2. 욕의 基本(기본)
    3. “좆“이 사용된 욕
    4. “씹”이 사용된 욕
    5. 身體(신체)에 관한 욕
    6. 출생및 사망에 관한 욕.
    8. 욕 속의 개(犬).
    9. 동물이 쓰이는 욕.
    10. 직업에 관한 욕.
    11. 맺음말.

     


    세계 욕 사전 [링크]

     

    184개 한국어 욕 번역 (영문표기 한국욕 -> 영문해석) 

     


    [동영상] 봉알선생의 우리 욕 기행 [링크]

     

    [나무위키] 내용 소개 [링크]

    우리 욕의 기원과 용례에 대해 나름대로의 사상과 철학을 반영하여 맛깔나게 강의한 것이 특징이다.

    황봉알의 개량한복에 둥근안경과 올빽머리 복장 및 강의도 재미있지만, 여러 사례를 보여주기 위한 참고자료들에 신경을 많이 쓴 제작진의 장잉력 또한 일품이다. 참고자료는 주로 1990년대 개봉된 국산 영화들의 장면이 많이 나왔다.[5] 그나마 욕 사용이 자유로운 매체는 예나 지금이나 영화가 거의 유일하기 때문에. 그조차도 여의치 않으면 스탭들이 직접 촬영한 영상을 만들어 틀어준다.

    단순히 욕만 정리한 것도 아니고 은어나 비속어 등도 정리하여 강의를 했기 때문에 나름대로 볼만한 요소가 많다.

    하지만 애초에 욕을 주제로 한 강의인데다가 욕의 근원을 설명하는 과정에서 성적인 발언이 많기 때문에 시청에 주의할 필요가 있다.

     

    에피스도 일람

     1회 개새끼[A]
     2회 씨발의 용법과 변천사
     3회 씨발의 기원과 활용
     4회 씹의 파생어
     5회 좆1 좆 2
     6회 좆의 파생어
     7회 중간고사
     8회 흘러간 우리 욕[A]
     9회 신체에 관한 욕 상체편
    10회 신체에 관한 욕 하체편
    11회 은어 1부[10]
    12회 은어 2부
    13회 수욕
    14회 봉알선생 전격 사퇴 선언
    15회 기말고사
    16회 미국인의 욕
    17회 성에 관련된 비속어
    18회 욕의 전략과 전술 1부
    19회 욕의 전략과 전술 2부
    20회 종강

     

     

     


    욕설에 담긴 뜻 '앗! 이럴수가…' (TS 기자단 배윤정 기자) - 원본 복구 [링크]

     

    좋은 말은 기억하지 못하더라도 누구라도 나쁜 말을 들었을 땐, 그 말을 뱉은 사람에 대한 안 좋은 기억과 
    인상이 두고두고 뇌리에 남게 됩니다. 물론, 반인륜적인 범죄자나 사회에 물의를 일으킨 사람을 지탄할 때, 
    욕을 하면 후련할 수 있겠죠. 그렇다 하더라도, 욕의 의미를 정확히 알고도 쉽게 남발하듯 쓸 수 있을까요? 

     


    욕필터링 (AsUs의 좋은 세상 만들기) [링크]

    badwords 리스트 제공

     


    한국어 욕설 감지 데이터셋 (조준희) [링크]

     

    데이터

    일간베스트(일베), 오늘의 유머와 같은 각종 커뮤니티 사이트의 댓글에 대해 총 5,825문장을 분류. 수직선 기호( | )를 기준으로 좌측에는 댓글 내용, 우측에는 욕설 여부(0,1)를 기록.

    분류 기준

    • 단순 욕설, 인종 차별적인 말, 정치적 갈등을 조장하는 말, 성적·성차별적인 말, 타인을 비하하는 말, 그 외에 불쾌감을 주거나 욕설로 판단되는 말
    • 일베에서 흔히 말 끝에 '-노'를 붙이는 것은 고 노무현 대통령을 희화화하기 위한 의도이므로 욕설로 봐야 하지만 경상도 사투리 '-노'와 구분하기 어렵다는 점에서 다른 욕설 없이 '-노'만 붙인 문장들은 욕설로 분류하지 않았습니다.
    • '존맛', '개이득' 등의 말은 비속어를 포함하고 있으므로 욕설이라 볼 수 있으나 최근에는 강조의 의미로 흔히 쓰이고 있으므로 악의가 없는 단순 강조의 의미로 쓰였다고 판단될 경우 욕설로 분류하지 않았습니다.
    • 상황에 따라 욕일 수도 있고, 아닐 수도 있는 댓글은 최대한 비욕설로 구분했습니다.

     


    한국어 욕설 데이터 세트 - Korean HateSpeech Dataset [링크]

     

    욕설을 감지하기 위한 최초의 인간 주석 한국어 말뭉치와 라벨링되지 않은 대규모 말뭉치를 제공. 이 자료는 엔터테인먼트 연예 뉴스에 달린 댓글을 수집하여 라벨링 처리.

     

    1. labeled

    사람이 라벨링한 댓글은 총 9,381개입니다. 이 데이터는 7,896개의 훈련 세트, 471개의 검증 세트, 974개의 테스트 세트로 나뉜다. (예측 모델의 공정한 비교를 위해 테스트 세트의 레이블은 공개하지 않았습니다. 모델은 이 문서의 뒷부분에서 설명할 Kaggle 제출을 통해 평가할 수 있습니다.) 
    혐오 발언이 편견과 밀접한 관련이 있다는 점을 고려하여 개별 댓글에는 사회적 편견과 혐오 발언의 존재라는 두 가지 측면에 대한 주석을 달았습니다.

    사회적 편견의 경우 성별, 기타 및 편향 없음 라벨을 제시합니다. 공인들이 주로 성별과 관련된 고정관념을 주로 접하는 한국 연예 뉴스의 맥락을 고려해, 만연한 편향성에 더 큰 비중을 두었습니다. 또한 댓글에 성별 편견이 포함되어 있는지 여부에 관계없이 바이너리 라벨을 추가했습니다. 증오심 표현에 대하여 증오, 불쾌, 없음 라벨을 도입했습니다.

     


    이 선 넘으면 침범이야, BEEP! - 혐오탐지 모델 개발을 위한 데이터 세트 구축 (문지형 조원익) [링크]

     

    설명

    온라인에서 발생하는 혐오표현은 널리 알려진 사회적 문제입니다. 익명성 때문에 혐오의 강도가 오프라인에 비해 더욱 세고, 온라인 상에 기록되기 때문에 그 내용을 지지하는 집단만 있다면 쉽게 불특정다수에게 확산되어 피해의 강도가 증폭됩니다. 최근에 발생한 일련의 비극적인 사건들로 포털 사이트들은 연예 및 스포츠 뉴스의 댓글란을 폐쇄하는 조치를 취했지만 그 곳이 아니더라도 혐오 발언은 어딘가에서 계속 표출이 되고 있기 때문에 다소 아쉬울 수 있는 해결책입니다.

    이 때문에 어떤 텍스트에 혐오발언이 담겨 있는지 아닌지를 검출하는 모델은 불필요한 곳에서의 혐오 확산 및 노출을 제어할 수 있다는 면에서도, 표현의 자유를 침해하지 않고도 혐오발언으로 인한 피해를 감소시킬 수 있기 때문에도 중요합니다.

    하지만 좋은 혐오탐지 모델 개발을 위해서는 우선, 좋은 데이터셋이 필요합니다. 그래서 이번 발표에서는 데이터를 구축하기 위해 했던 고민과 삽질기, 그리고 완성된 데이터를 활용해서 학습한 혐오탐지 모델을 소개할 예정입니다. 발표를 통해 혐오발언에 대한 다양한 논의와 모델 개선을 위해 필요한 작업들에 대한 토의가 이루어지길 기대합니다.

     


    한국어 악성댓글 데이터셋 - korean-malicious-comments-dataset (Sung-Min Lee)

     

    • Korean Haste speech dataset 에서 hate ->0 none ->1 라벨링, offensive는 활용하지 않음 (0:1818 1:3364), 공격적이라고 악성댓글은 아니기 때문.
    • 욕설감지데이터셋 에서 욕설문장만 데이터셋으로 활용 (0:2032), 욕이 안들어갔다고 해서 악성댓글이 아닌 건 아니기 때문.
    • 본인이 직접 라벨링한 데이터셋 (0:1150 1:1636)
    • 라벨링 기준은 욕설이 들어갔거나, 강한 혐오표현, 비난이 들어갔을 경우 0으로 라벨링하였다.

     


    'KcElECTRA'로 악성댓글 분류 모델 만들기 - 파이썬/Colab (디노랩스 hahagunner) [링크]

     

    KcELECTRA 모델을 파인튜닝하여 악성댓글을 분류할 수 있는 딥러닝 모델 구축

     


    욕설 검색 마스킹 BERT 모델 - Purifier 모델 (Team Matmul) [링크]


    Project-Purifier는 BERT 모델을 활용한 욕설 판단 및 마스킹 서비스입니다. library에는 웹사이트 크롤링 코드(Youtube, Naver news, ilbe, namuwiki), 크롤링 데이터 전처리 코드, 한글 구어체 300만 문장이 추가로 학습된 pre-trained 모델, 욕설 판단을 위한 fine-tunning 학습 코드, 입력 문장 욕설 판단 및 마스킹 코드가 포함되어 있습니다.

     

    욕설 마스킹 알고리즘

    • 문장 전체를 봤을때 욕설 판단이 1로 나오는 경우(욕설이 있는 문장)에만 마스킹 알고리즘이 적용됩니다.
    • 핵심은 puri attention에서 나오는 Attention Prob을 비교하여 가장 높은 값을 욕설이라 판단하는 것입니다.
    • BERT의 tokenize 방식이 단어 혹은 형태소 단위가 아니라, wordpiece 방식으로 구성되어 있어 한 토큰이 일정 확률을 넘어선 경우, 그 토큰을 포함하고 있는 단어 전체를 마스킹 하는 방식으로 구현하였습니다.
    • 가장 높은 확률의 토큰이 포함된 단어를 마스킹하고, 욕설 판단이 0(욕설이 없는 문장)이 될때까지 같은 과정을 반복합니다.

    클린봇 2.0: 문맥을 이해하는 악성 댓글(단문) 탐지 AI (Naver D2) [링크]

     

    악성 댓글(이하 '악플')의 자극적이고 공격적인 표현은 보는 이의 감정을 상하게 하고, 싸움을 부추기고, 집단 간의 갈등을 심화시키는 등 사용자의 서비스 이용 경험을 질적으로 저해합니다. 댓글은 어떤 사용자가 어떤 내용으로 작성할지라도 중심이 되는 콘텐츠의 주목도에 따라 다수의 사람에게 쉽게 노출이 될 수 있습니다. 따라서 소수의 악의적인 댓글만으로도 다수 사용자에게 큰 정신적 피해를 초래할 수 있고, 이러한 댓글 작성 습관은 쉽게 전염되기도 합니다. 온라인 소통의 영향력이 그 어느 때보다 커진 현대 사회에서 이 문제는 중요하게 다루어져야 하며, 다양한 분야에서 위상을 떨치고 있는 AI 기술력이 반드시 투입되어야 할 영역입니다.

    이러한 문제 의식 하에 이용자피드백플랫폼은 악플에 대한 사용자 반응을 지속해서 모니터링하고 악플 관련 학술 연구 자료와 방송통신심의 위원회의 기준 등 여러 자료를 면밀히 살펴보며 악플이란 무엇인지에 대해 활발히 논의했습니다. 논의를 통해 악플을 유형화하고 그에 따라 데이터를 구축했으며, 기술을 통해 데이터의 노이즈를 제거함으로써 데이터의 품질을 높였습니다.

     


    badwords.json [링크]

     

    badwords 리스트를 json 파일 형태로 제공

     


    11. 우리말 상말 욕설 등 관련도서

     

    宋在璇 ( 1993 ) 상말속담사전, 東文選 [링크]

     

    [책소개] 상말속담은 직장에서 얻은 스트레스를 지우는데나 하루의 지친 피로를 푸는 데나, 또는 이러저러한 불쾌지수로 침울한 기분이나 분위기를 바꾸는 데 특효를 가진 속담이기도 하다. 상말속담은 누구나 속으로 즐기는 속담이지만, 특히 농담을 잘하거나 유머성이 풍부하거나 Y담을 즐기거나 장난을 좋아하는 사람들이 즐기고 애용하며, 따라서 가장 많이 간직하고 있는 속담이다.

    宋在璇 ( 1995 ) 여성속담사전, 東文選  [링크]

     

    [책소개] 현모양처, 열녀, 효부효녀, 며느리, 부정한 여성, 갈보, 화냥년 등 여성들의 천태만상을 한눈으로 재미있게 살펴보는 것은 물론, 여성학 연구에 귀중한 자료가 된다.

     

    宋在璇 ( 1995 ) 농어속담사전, 동문선 [링크]

     

    [책소개] 옛날은 물론 지금도 반드시 소용이 되고 있는 농어업에 관련된 속담모음집. 농어민들의 희비애락, 농어업에 관한 기술과 지혜, 계절과 날씨에 관한 예지 등 농어업 지침서이자 조상들의 농심과 어심을 되새겨보는 고전.

    - 목차

    1 기 상 편
    2 영 농 편
    3 원 예 작 물 편
    4 가 축 편
    5 어 업 편

     

     

    송재선 ( 1997) 주색잡기 속담사전, 동문선 [링크]

    [책소개] 술편, 색편, 잡기편으로 나눠 오랜 세월 우리 민중의 지혜와 생활철학이 담긴 교훈적 속담을 엮었다. 술, 술장사, 술맛, 해장술을 비롯해 홀아비,과부, 기 생, 성교, 노름, 노름꾼, 바둑, 장기, 윷놀이까지 52 주제로 속담을 분리해 실었다.

     

    宋在璇 ( 1997 ) 동물속담사전, 東文選 [링크]

     

    [책소개] 길짐승, 날짐승, 고기 등으로 나누어 동물과 관련된 속담을 총합해 엮었다. 개, 소, 말 에서부터 용, 고래, 앵무새, 진드기, 바구미에 이르기까지의 164종의 동물에 대한 속담 8백여 종을 모았다.

     

    송재선 (1998) 음식속담사전, 동문선 [링크]

     

    [책소개] 음식편,밥편,국편,장류,술담배편 등으로 나눠 음식과 관련된 각종 속담을 수록한 책. 가만히 먹는 음식이 체하기 쉽다, 개천에 든 소다, 곤자소니에 발기름이 끼었다 등 각종 속담을 크게 여섯가지 음식과 소분류 로 나누고 가나다순으로 엮었다.

     

    송재선 (1998) 돈속담사전, 동문선 [링크]

    [책소개] 돈과 관련된 속담 5천여 어휘를 가나다순으로 체계있 게 정리하고 속담 속에 담긴 뜻을 해설한 속담사전. 돈과 관련된 속담을 돈거래,돈 걱정,주머니돈,백냥 , 돈벌이 등등 각각의 소주제로 나눠 엮고, 가난과 부유편으로 나눠 관련된 속담을 함께 엮었다.

     

     

    정태룡 ( 1994 ) 우리말 상소리 사전 I / II, 프리미엄 북스 [링크]

    [책소개] 일상 및 고급언어의 근간이 되는 상소리만을 모아 체 계적으로 정리한 책. `갓난아기느 어미 젖, 어미는 남편 좇 먹고 산다`, `머슴놈들 춤판이다` 등 속담과 문장을 바탕으로 각종 상소리를 추론하고 해설했다.

    서민들의 삶에 남아있는 상소리 6천여 항목을 수집, 가나다순으로 정리 해설했다.

     

     

    정태룡 ( 1997 ) 한국의 욕설백과, 한국문원 [링크]

    [책소개] 욕 잘하는 사람이 말도 잘한다. 욕, 은어, 비어, 속어, 상소리 속담. 우리 조상들의 질펀한 해학이 묻어 있는 욕설에서부터 현재 젊은이들 사이에 통용되고 있는 은어. 비어까지 저자가 전국을 누비며 취재한 3,000여 항목의 욕설 모음집. 한국의 욕설을 내용별로 분류하고 그 어원과 뜻을 풀이한 상소리 백과이다.

     

     

    정태룡 ( 2000 ) 토속어 성속어 사전, 우석 [링크]

     

    [책소개] 저자가 담백 솔직하며 공격적, 전향적이라는 특징을 지니고 있는, 설렁탕 투가리 같은 토속어들을 모아 놓았다. 이러한 특징은 잠시도 조용할 새 없이 북적거렸던 우리 역사에서 기인한 것이라고 저자는 말하고 있다. 민중들의 입에서 입으로 전해내려온 토속어들을 소설적 문장으로 풀어냈다.

     

    정태륭 (2009.09.09) 조선상말전  동서문화사 [링크]

    [책소개] 『조선상말전』에는 낙천적이면서도 진취적이고 해학이 넘치는 우리 겨레 미래지향적 원형질이 사실적이고 구체적인 상말을 통해 잘 드러나 있다. 이 책에는 옷이라곤 한 올도 걸치지 않은 천둥벌거숭이 말과 이야기들뿐이다. 그것들은 혐오감이 아닌 조선시대 적나라한 양반선비는 물론 일반서민들의 이불속 생활풍정을 훔쳐보는 것 같이 넉넉한 시선으로 바라볼 만한 것이다.

     

     

    박숙희 ( 1994 ) 뜻도 모르고 자주 쓰는 우리말 500가지 I / II, 서운관 [링크]

     

    [책소개] 말의 유래와 변천 과정을 '본뜻'과 '바뀐 뜻'에서 자세히 설명했으며, 실생활에서 쓰고 있는 사례도 '보기글'에 함께 담았다. 이 책에 수록한 우리말의 범주는 순우리말, 합성어, 한자어, 고사성어, 관용구, 일본어에서 온 말, 외래어, 은어를 포함한다.

     

    김종훈(2005) 은어 비속어 직업어 - 집문관 [링크]

     

    은어, 비속어, 직업어를 정리한 자료집. 남녀 중고등학생의 은어와 대학생의 은어, 산삼채취인의 은어, 도적 및 범죄인의 은어를 비롯하여 군대 비속어, 창녀어, 걸인어, 해녀어에 대한 내용으로 구성되어 있다. 또한 종래 봉건사회의 구중궁궐에서만 사용되었던 궁중어와 남북 분단의 이질성을 잘 나타낸 북한의 은어에 대하여도 함께 소개한다. '어휘풀이'는 일종의 사전적 성격을 띤 것으로, 총 1만 2600여 어를 수록하였다.

     


    관련 논문

    국어 비속어의 개념과 특징 (강남대 김동언 교수)

    이러한 비속어는 사회심리적인 요인이나 화맥(상황과 장면)과 관련되는 특징을 가지고 있 다. 우선, 비속어는 이미 위에 암시된 바와 같이, 심리적인 요인을 가지고 있다. 비속어는 화 자의 태도나 감정 등 심리적인 면을 덧들인 것으로 볼 수 있다.

     

    비속어와 욕설의 개념에 대하여 (이선영 , 중앙어문학회)

    국문 초록 (Abstract)

    일반적으로 비속어(卑俗語)는 ‘통속적으로 쓰는 저속한 말’이란 의미로 쓰인다. ‘비속어’는 ‘저속하다’ 즉 ‘품위가 낮고 속되다’란 속성이 있지만 대중적으로 널리 알려진 말을 의미한다. 대중적으로 널리 알려졌어도 비속어는 공식적인 자리 또는 격식을 갖추어야 할 자리에서는 쓰기 어려운 것이 사실이다. 또한 비속어 관련 연구 중에는 비속어를 욕설과 같은 부류로 보아, 쓰지 말아야 할 대상으로 처리하는 경우도 많다. 그러나 비어와 속어는 욕설과는 다른 특징이 있으며 그 의미에서도 차이가 있다. 비속어는 비어와 속어를 아우르는 개념인데, 비어(卑語)는 ‘대상을 낮추거나 낮잡거나 얕보는 말’로 평어(平語)와 대조되는 개념이다. 속어(俗語)는 ‘통속적으로 쓰는 속된 말’의 의미로 보통어(普通語)와 대조되는 개념이다. 욕설(辱說)은 ‘남을 모욕하거나 저주하는 말’이나 ‘화가 났을 때 혼자 감탄조로 하는 말’로 비속성이 있기는 하나 비속어와는 달리, 대응하는 보통어나 평어가 존재하지 않는 것이 특징이다. 비속어는 사용을 금지해야 할 말로 처리되는 경우가 있으나 그 금지 대상은 실상 욕설이며 비속어, 특히 속어는 생생한 느낌을 주는 말로 단어에 따라 그 용인성에 차이가 있다.


    [생활코딩] 한국어 욕설 리스트 요청 글 답변 [링크]

     

     


    * "ㅅ111발"도 잡아내는 욕설탐지기, 딥러닝으로 만들기

     

     


    * 국립국어원 "표준국어대사전" [링크]

     

    "비속어 목록이 따로 있지는 않지만, “표준국어대사전” 자세히 찾기 기능을 활용하여 비속어를 파악하실 수 있겠습니다.(자세히 찾기는 사전 찾기 창 오른쪽에 있습니다.) 자세히 찾기의 ‘찾는 말’에 ‘뜻풀이-포함 문자’를 고르시고, 내용에 ‘속되게 이르는 말’ (욕설) 을 쳐서 ‘찾기’를 누르시면, ‘속되게 이르는 말’로 풀이되는, “표준국어대사전”에 실려 있는 단어들이 모두 나옵니다."

     

     


    카카오TV 찐경규

     

    12회 한국인의 욕 [링크]

    무궁한 세월, 서민들의 정서를 담아온 우리의 '욕'이 본연의 의미를 잃어가고 있다?! 잊혀가는 욕 수집을 위해 전북 남원을 찾은 경규! 마을 어귀에서부터 들리는 구수~한  🗣소리에 취하고 마는데!

     

    36회 한국인의 욕 - 제주편 [링크]

    제주어 알못(?) 경규를 위해 통역사 자청한 세븐틴 승관🍊 "이 동네 심상치 않은데요..👀?!" 🗣경규야 조끄테! 조끄테! 욕 아닌데 욕처럼 들리는 말부터 제라 지꺼져!! - 제주어 버전으로 바꿔본 '아주 NICE' 제주어로 영상편지 남기는 미국인의 등장까지..? 제주 출신 승관도 난생처음 들어보는 제주어 파티🎊 제라 지꺼져👍한 하루 대공개!


    악성 댓글 예측 - 주어진 댓글 텍스트가 악성 유무 예측(캐글코리아) [링크]

    (5차 캐글 컴페티션 챌린지 with KaKR: 악성 댓글 예측)

    " 이번 컴페티션의 목적은 주어진 댓글이 악성일 확률을 예측하는 동시에, 이러한 ‘정체성’의 표현으로 인해 의도치 않게 잘못 학습 및 예측이 되는 경우를 최대한 줄이는 것입니다."

    데이터셋 소개

    Note: 본 Competition은 악성 댓글을 예측하는 대회이며, 주어진 댓글 데이터에는 간혹 혐오 및 성적인 표현 등이 다소 포함될 수 있음에 유의.

    이 Competition에서 사용된 데이터는 Civil Comments라고 불렸던 한 온라인 플랫폼에서 다양한 사람들이 남긴 댓글 데이터로 구성. 한 연구기관에서 댓글 데이터를 표현할 수 있는 여러 속성을 추가로 라벨링 하였고, 그 결과 아래와 같은 데이터 셋으로 구성.

    반응형

    댓글