본문 바로가기
반응형

분석데이터10

통합 데이터 지도 (한국지능정보사회진흥원 ) 통합 데이터 지도 (한국지능정보사회진흥원 ) * 사업목표 통합 데이터 지도는 공공과 민간에서 제공하는 데이터를 쉽게 검색∙활용할 수 있도록 지원합니다. 통합 데이터 지도는 데이터 생태계의 나침반 같은 역할을 하여 필요한 데이터를 데이터댐에서 쉽게 찾아 잘 활용할 수 있도록 하겠습니다. * 사업 추진배경과 필요성 디지털 뉴딜의 핵심 ‘데이터댐’ 코로나19에 따른 비대면화 확산으로 디지털화는 국가 경쟁력의 핵심 요소로 부각되고 있습니다 정부는 공공과 민간의 데이터가 개방·연계·활용·확산될 수 있도록 데이터댐을 구축하여 디지털 전환을 선도하고 있습니다. 과학기술정보통신부와 한국지능정보사회진흥원은 분야별 빅데이터 플랫폼 및 센터를 구축하여 데이터의 수집‧유통을 활성화하고 통합 데이터 지도를 통해 누구나 양질의 .. 2021. 12. 30.
욕설에 담긴 뜻 '앗! 이럴수가…' (TS 기자단 배윤정) 욕설에 담긴 뜻 '앗! 이럴수가…' 2012.01.30 | 한글 사용설명서 | TS_Seoul 중학생쯤 보이는 한 무리의 남자 아이들이 키득거리며 지나갑니다. 그런데, 아이들끼리 나누는 대화 내용이 가관이더군요. 단어 하나에 욕 하나씩, 마치 짝을 지은 것 연결해서 말을 하는데 듣기 민망했습니다. 과연 욕에 담긴 속뜻을 알고도 쉽게 입에 담을 수 있을지 의문스럽기도 해요. 사람들은 욕을 속이 상할 때 혼잣말처럼 내뱉거나, 미운 상대를 지탄할 때 사용합니다. 그러나 우리가 쉽게 듣고 사용하는(?) 욕의 어원 중엔 얼굴이 화끈거리는 난잡한 성(性)적 표현을 난잡하게 담고 있거나, 지금은 사라졌지만, 옛날엔 큰 죄를 저지른 죄인은 처형하였는데 그 방법이 참혹하고 형도 다양했습니다. 욕설들 가운데에는 그러한 형.. 2021. 12. 3.
한국의 욕설 사전 리스트 한국의 욕설 사전 리스트 욕설 사전 제작을 위한 참고 자료 욕설 사전을 제작하시는 분의 글을 보고서 과거에 정리한 자료를 공유합니다. *********************** 예전에 욕설사전 제작하려고 찾았던 기억이 나네요. 단어매칭으로 처리하려다 보니 년도(숫자) 처리가 문제였던 기억도. "봉알선생의 우리 욕 기행" 영상을 탐독하며 새로운 욕을 많이 배웠는데. 우리말 욕은 하도 다양하고 변화무쌍하여서 놀랍기 그지 없어서 감탄을 하였습니다^^ 글 보실 때는 후방 조심히 보시기를 주의 부탁 드리며 자료 링크 공유합니다. 과거 자료여서 최신 신조어를 추가 하셔야합니다. 국어 비속어 사전 (강남대 김동언 교수) 책소개 문학 작품 및 실생활에서 쓰이고 있는 비속어를 구체적인 용례와 함께 일목요연하게 집대성한 .. 2021. 12. 1.
3.1운동 100주년 기념 "삼일운동 데이터베이스" 서비스 개시(국사편찬위원회) 3.1운동 100주년 기념 "삼일운동 데이터베이스" 서비스 개시(국사편찬위원회) 국사편찬위원회는 삼일운동 연구를 심화하고 국민들의 삼일운동에 대한 관심과 이해를 높이고자 2016년부터 3년에 걸쳐 삼일운동 관련 기초 정보를 종합하고 GIS(지리정보시스템)와 연동하여 제공하는 데이터베이스를 구축. 3.1운동 100주년을 기념하여 2월 20일(수) "삼일운동 데이터베이스" 서비스 개시. 해당 데이터베이스의 가장 큰 특징은 전국적인 3.1운동 현황을 한 눈에 파악하도록 시각화한 점이다. 지리정보시스템과 연동해 당시의 시위 정보를 지도상에 나타내기 때문이다. 데이터베이스에서 제시되는 시위 정보는 올해 2월을 기준으로 나타낸 것으로 향후 관련 연구의 진전에 따라 업데이트가 가능 ※ 삼일운동 데이터베이스 URL :.. 2019. 2. 20.
데이터가 없어서 AI, DS 못 한다고 하지마세요 1(낭만학습자의 IT기술이야기 김영하) 데이터가 없어서 AI, DS 못 한다고 하지마세요 1(낭만학습자의 IT기술이야기 김영하) * 캐글 (https://www.kaggle.com/)이 글을 쓰고 있는 현재 캐글에서는 14,523개의 데이터셋을 공개하고 있습니다. 1) crowdAI : https://www.crowdai.org이 사이트는 경진대회 같은 Challenges 가 있습니다. 현재 13개가 진행중에 있으며, 38개가 완료된 상태입니다. 아직 사이트가 시작된지 얼마 안 되어서 인지 몇 개 없지만, 앞으로도 계속 추가될 것이라 생각됩니다. 스위스의 EPFL이라는 곳에서 관리를 하고 있다고 합니다. 계속 지속되었으면 합니다. * 출처 : http://m.fnnews.com/news/201902180922182850 2019. 2. 19.
인공지능(AI) 학습용 공개데이터 4400만건으로 확대(동아사이언스) 인공지능(AI) 학습용 공개데이터 4400만건으로 확대(동아사이언스) 인공지능 허브 확대의 핵심은 AI 학습용 데이터 제공을 확대하는 것이다. 1월 중에 관광, 농업, 헬스케어 분야 공개 학습용 데이터를 추가한다. 4월에는 한국어음성, 대화 등 4종이 추가 개방된다. 이후로도 올해 말까지 한국어-영어 번역 말뭉치 등 10종 2500만 건의 AI 학습용 데이터가 추가된다. 과기정통부는 지난해까지 일반상식, 한국형이미지, 특허, 법률 등 4종 1436만 건이던 공개 데이터가 약 4400만건으로 늘어날 것으로 보고 있다. * 출처 : http://m.dongascience.donga.com/news.php?idx=26400 ************************************************.. 2019. 2. 5.
국립국어원 세종 말뭉치(sejong-corpus) 다운로드 스크립트( 최호진 (Hojin Choi)) 국립국어원 세종 말뭉치(sejong-corpus) 다운로드 스크립트( 최호진 (Hojin Choi)) * 스크립트 제작 이유 - 세종 말뭉치 관련 파일들이 1400개가 넘습니다. 또한 전체 크기는 2GB에 해당. - 게시판을 통해 하나씩 받는데 어려움이 있습니다. - 말뭉치에 사소한 오류들이 있습니다. 또한, 세종 말뭉치는 개작 및 재배포를 허용하지 않는 라이센스를 가지고 있습니다. 따라서, 연구자들이 말뭉치를 받아 오류를 고쳐도 재배포가 허용되지 않습니다. * 출처 : https://github.com/coolengineer/sejong-corpus?fbclid=IwAR1eHgz5ske4YFYlqSA8SnAhjvlhI2vlzSlyT78nFLBFUcy_geDU-lDa0OE * 참고 : 세종 말뭉치 - 국.. 2018. 12. 21.
머신러닝을 위한 50가지 공용 데이터세트(Data Driven investor Stacy Stanford) 머신러닝을 위한 50가지 공용 데이터세트(Data Driven investor Stacy Stanford) - UCI Machine Learning Repository - VisualData - Data.gov - Food Environment Atlas - 학교 시스템 재정 - 만성 질환 데이터 - 미국 교육 통계 센터 - 영국 데이터 서비스 - 미국 공개 데이터 - Quandl : 경제 및 금융 데이터 - 세계은행 개방 데이터 - IMF 자료 - 파이낸셜타임즈 마켓 데이터 - 미국 경제 협회(AEA) - Labelme : 레이블이 달린 이미지 데이터세트 ... * 출처 : https://medium.com/datadriveninvestor/the-50-best-public-datasets-for-ma.. 2018. 12. 20.
기억해두면 유용한 통계지표 사이트 12곳(퀘벤하운/ㅍㅍㅅㅅ) 기억해두면 유용한 통계지표 사이트 12곳(퀘벤하운/ㅍㅍㅅㅅ) "업무를 하거나 글을 쓸 때는 다양한 통계지표를 사용할 경우가 있다. 이 경우 가급적 신뢰도가 높은 자료를 사용해야 하며, 때로 나의 논리와 통계지표가 상이하다면 그 논리를 수정해야 하는 경우도 있다." -한국은행: 한눈에 보는 우리나라 100대 통계지표 - 통계청: 품목별 생산자 물가지수 / 소비자 물가지수 - 통계청: 소득 10분위별 가구당 가계수지 - 국회예산정책처: 분석평가보고서 - 서울시: 연도별 예산서 - 국토교통부: 실거래가 공개시스템 - 대한건설협회: 주요건설경기지표 - OECD: Data - Nasdaq: Commodity Prices - 인도중앙은행(RBI): RBI BULLETIN - 댈러스 연방준비은행(Dallas FED).. 2018. 12. 18.
우편번호를 통한 지역구분에 대한 분석시 참고 우편번호가 있다면 우체국(우정사업본부)에 가셔서 우편번호 DB를 다운 받으셔서 조인 거시는것이 가장 안전합니다. http://www.koreapost.go.kr/kpost/sub/subpage.jsp?contId=010101040300 우정사업본부 고시 우편번호 DB (현재 사용되고 있는 전체 우편번호 DB임) [통계분석연구회] http://cafe.daum.net/statsas 백승민님의 파란블로그에서 발행된 글입니다. 2018. 11. 20.
반응형