본문 바로가기
반응형

데이터과학자 진로정보/데이터 과학 & 통계도서33

데이터과학자의 사고법 (서울대 김용대 교수, 김영사) 데이터과학자의 사고법 (서울대 김용대 교수, 김영사) 더 나은 선택을 위한 통계학적 통찰의 힘 * 책소개 한 치 앞도 예측불가능한 시대를 건너는 가장 확실한 방법 혼돈의 세계에서 규칙을 발견하는 데이터과학의 모든 것 데이터과학자가 알려주는 불확실성을 이해하고 대비하는 사고법. 세계를 움직이는 법칙이자 본질인 통계와 확률을 어떻게 이해하고 이를 바탕으로 미래를 대비해야 하는지 알려준다. 과학의 영역을 넘어서 불완전한 사회에서 우리가 불완전한 선택을 할 수밖에 없음을 깨달을 때 비로소 서로에 대한 이해와 협력이 가능해진다는 통찰을 보여준다. * 목 차 프롤로그: 데이터과학으로 들어가기 1부 데이터 리터러시: 숫자 없는 통계학 1장 역사 속의 데이터 - 무지와 탐욕을 밝히는 열쇠 2장 불확실한 세상을 위한 언.. 2023. 6. 28.
매트랩 코드와 함께 하는 마르코프 체인 몬테카를로(이효남, 자유아카데미) 매트랩 코드와 함께 하는 마르코프 체인 몬테카를로(이효남, 자유아카데미) 이 책에는 새로운 이론이 전혀 없다. 아름다운 수식으로 가득한 책이 넘치도록 많다는 것도 안다. 구글 검색에서 키워드 몇 단어만 입력해도 너무나 많은 정보가 눈 앞에 펼쳐진다. 개중에는 친절한 글도 많다. 하지만 기초지식 없이 그 내용을 읽고 이해하는 것도 만만한 일은 아니다. 매트랩 같은 상용 프로그램이나 무료로 이용 가능한 프로그램 소스, 패키지도 넘쳐난다. 이들 중에는 몇 단어만 입력해도 엄청난 출력들을 보여주는 것도 있다. 문제는, 어떻게 해야 제대로 쓰는 것인가? 내 문제 해결에 어떻게 적용할 것인가? 그 결과는 맞는 것인가? 이 답들을 얻는 것은 자신이 적용하려는 방법의 기초를 이해하지 않고는 불가능하다. 이 책은 이러한.. 2023. 5. 11.
AI·SW교육을 위한 초중등 창체 운영가이드(한국교육학술정보원) AI·SW교육을 위한 초중등 창체 운영가이드(한국교육학술정보원) 본 이슈리포트는 초 중등학교에서 일반 교과는 물론 창의적 체험활동 유형과 다양한 주제 학습활동과 연계 등 교육과정을 재구성하여 AI SW교육을 연계할 수 있는 초중등 교육과정 편성 운영 등 교육과정 설계와 운영에 대한 정보를 제공하였다. 초중등 학교의 교과, 창의적 체험활동 등 교육과정을 재구성하여 AI 디지털로 인한 교육 환경 변화와 인공지능 시대를 살아갈 학생들이 디지털 역량을 기르기 위해 AI SW교육을 보다 효과적으로 운영하기 위한 교육과정 설계에 도움 되는 정보 및 학교급별 운영 사례도 담았다. 또 학교 현장에서 다양한 주제 학습활동과 연계한 AI SW교육을 추진하기 위해 고려할 교육 요소 및 교육활동 사례도 일부 소개하여 참고할 .. 2023. 4. 19.
2023 인공지능 학습용 데이터 품질관리 가이드라인 및 구축 안내서 v3.0 (NIA 한국지능정보사회진흥원) 2023 인공지능 학습용 데이터 품질관리 가이드라인 및 구축 안내서 v3.0 (NIA 한국지능정보사회진흥원) 인공지능 학습용 데이터의 품질 확보를 위한 ‘인공지능 학습용 데이터 품질관리 가이드라인 및 구축 안내서 v3.0’ 입니다. (제1권) 품질관리 가이드라인 v3.0 1. 총론 2. 품질관리 체계 - 품질관리 프레임워크 - 품질관리 프로세스 및 산출물 - 품질 자가점검 및 품질검증 3. 부록 - 품질관리 기준 - 품질지표 설정 가이드 - 개인정보보호 가이드 4. 참고자료 (제2권) 구축 안내서 v3.0 > 부제 : 산출물 작성 가이드 1. 총론 2. 주요 산출물 작성 안내 - 구축 계획서 - 품질관리 계획서 - 구축공정 가이드라인 - 품질관리 결과서 - 품질지표 기준서 - 활용 가이드라인 3. 부록 .. 2023. 4. 6.
보건의료 빅데이터 연구방법론(약학빅데이터연구회, 자유아카데미) 보건의료 빅데이터 연구방법론(약학빅데이터연구회, 자유아카데미) 국내 보건의료 빅데이터 활용 연구방법부터 머신러닝 분석까지 * 머리말 이러한 상황에서 맞이한 4차 산업혁명 시대에는 약학 분야에서도 빅데이터와 인공지능이라는 키워드를 간과할 수 없게 되었으며, 약학 교육에서도 빅데이터, 인공지능, 머신러닝 등에 대한 이해, 그리고 이를 활용하여 분석하는 방법과 그 결과를 해석하는 능력을 갖추는 것이 중요하게 되었다. 이에 통합 6년제 교육과정에서는 의약품 연구의 실제 사례 등을 포함한 보건의료 빅데이터 연구방법 관련 능력을 학생들이 습득할 수 있도록 해야 한다는 필요성이 제기되었고, 뜻을 함께한 열 분의 사회약학분과회 교수와 열다섯 분의 초빙 저자가 약학빅데이터연구회를 조직하여 이번 교재 집필에 참여하게 되었.. 2023. 3. 29.
코딩 없이 배우는 데이터 과학(황보현우, 한노아 저 , 성안북스) 코딩 없이 배우는 데이터 과학(황보현우, 한노아 저 , 성안북스) * 책소개 별도의 코딩 없이 데이터를 분석하는 No Code, Low Code의 시대! 데이터 과학 입문자와 비전공자를 위한 데이터 분석의 새로운 방법을 제시하다! 인공지능의 발전에 따라 별도의 코딩 없이 데이터를 분석하는 No Code, Low Code의 시대로 전환되어 가고 있다. 이러한 흐름에 따라 저자는 데이터 과학 분야의 전문가들이 아닌, 입문자 및 비전공자 등 일반인도 쉽고 빠르게 실무에서 바로 사용할 수 있는 데이터 분석의 새로운 방법을 이 책에 소개하였다. 제1장. [데이터 과학을 위한 체계]에서는 데이터 과학에 접근하는 방법을 소개한다. 여기서는 데이터 과학에 접근하는 다양한 관점과 이 책에서 채택하는 프레임워크에 대해 설.. 2023. 3. 14.
교원을 위한 인공지능(AI) 첫걸음(서울특별시교육청) 교원을 위한 인공지능(AI) 첫걸음(서울특별시교육청) ▢ 인공지능을 활용하고, 인공지능과 협업해야하는 인공지능 시대에는, 인공지능 기술의 원리, 인공지능 기술의 한계, 인공지능 윤리 등을 잘 알고 인공지능이 사회에 미치는 영향을 비판적으로 이해하는 역량인 인공지능 리터러시가 필수적이다. 이러한 인공지능 리터러시 교육이 전 교과에 걸쳐 이루질 수 있도록 교원의 인공지능에 대한 이해를 돕고, 교과와 연계하여 인공지능 윤리교육이 내실 있게 이루어질 수 있도록 하기 위해 교육자료 2종을 개발‧보급하게 되었다. ▢ 「서울형 인공지능 윤리교육 자료(초등학교용)」는 서울미래교육 핵심가치인 존엄, 포용, 공존과 국가수준 인공지능 윤리기준의 3대 기본원칙을 융합하여 교육과정에 바로 적용할 수 있는 인공지능 윤리교육 내용.. 2023. 3. 7.
비모수통계학 with R (자유아카데미 정성규) 비모수통계학 with R (자유아카데미 정성규) * 머리말 이 책의 제I부에서는 바로 이 전통적인 비모수통계의 방법론을 다룬다. 전통적인, 순위에 기반한 방법들은 1930년대부터 60년대까지 주로 연구가 이루어졌지만, 지금도 그 방법들이 실제 데이터 분석에서의 중요한 도구 중 하나이므로 중요한 방법론이라고 볼 수 있다. 이 책이 다른 전통적인 비모수통계를 다룬 책들과 다른 점은, 전통적인 비모수통계에서의 추론을 모두 순열검정의 특수한 경우로 설명한다는 점이다. 피셔(R.A. Fisher)가 처음 도입한 순열검정은 데이터의 뒤섞기를 통해 가설검정에서의 정확한 영분포를 구하는 방법이다. 뒤섞기를 이용한 추론 또는 순열검정은 제I부에서 다루는 전통적인 데이터 분석의 상황뿐 아니라 회귀분석에서의 추론, 그리고 .. 2022. 1. 21.
R과 Python을 이용한 비모수통계학 (박상언, 자유아카데미) R과 Python을 이용한 비모수통계학 (박상언, 자유아카데미) * 머리말 학부에서 15년간 비모수통계학을 강의하면서 정리한 내용을 책으로 출간하게 되었다. 기초통계학 수준의 내용을 숙지한 비전공자를 대상으로 교재의 난이도를 조절하다 보니, 내용상 수학적 유도보다는 코딩에 중점을 두게 되었으며, 가급적 기초통계학의 내용과 연결하여 설명하고자 하였다. 책의 1장, 2장, 3장에서는 학부 수준의 통계학입문, 통계방법론의 내용을 간략하게 설명하였다. 그리고 4장과 5장에서는 순위를 이용한 비모수검정 방법들을 설명하였는데, 4장에서는 독립인 집단들의 비교에 대한 비모수검정 방법, 5장에서는 독립이 아닌 집단들의 비교에 대한 비모수검정 방법을 설명하였다. 그리고 6장에서는 분포함수와 Quantile 등을 이용하여.. 2021. 12. 22.
3일 만에 끝내는 코딩 통계 (박준석 지음 | 사회평론아카데미) 3일 만에 끝내는 코딩 통계 (박준석 지음 | 사회평론아카데미) R언어 설치부터 코딩까지 * 책소개 통계와 코딩은 이제 현대인의 기초 소양이 되었다. 이 책은 코딩 초보자, 통계 비전문가를 위한 입문서로서, 3일 만에 코딩과 통계의 감을 잡을 수 있도록 해준다. 사용하기 쉽고 통계에 최적화된 R 언어를 설치하는 것(1장)부터 차근차근 알려준다. 그리고 고등학교 때 배운 순열과 조합(2장)부터 시작해 확률(3장), 조건부확률(4장), 확률분포(5장), 통계적 추정(6장)까지 따라가며 통계를 코딩으로 함께 풀어본다. 몇 줄의 코드를 직접 입력하고 실행해보면서 통계적 개념을 명확히 알게 되고 코딩까지 자연스럽게 익힐 수 있게 될 것이다. 여기에 더해 컴퓨터 성능이 고도로 발달한 시대의 통계 기법인 부트스트랩(.. 2021. 12. 1.
R과 함께하는 의학통계 : 비교분석 연구에서의 표본크기와 검정력(차재형 , 자유아카데미) R과 함께하는 의학통계 : 비교분석 연구에서의 표본크기와 검정력(차재형 , 자유아카데미) 임상시험연구에서 가장 중요한 사항 중 하나가 연구목적에 따른 필요 대상 환자 수(표본크기)를 결정하는 것이다. 대부분의 임상시험은 통계적 유의성을 판단하기 위하여 유의확률(p-value)을 구하고 그 결과에 따라 통계적 의사결정을 하게 된다. 하지만 표본크기는 고려하지 않고 지나치게 유의확률에 의존하다 보니 통계적으로 유의하나 검정력이 떨어져 연구결과의 신뢰성이 무너지는 경우가 많이 나타나고 있다. 표본크기의 결정은 연구설계 단계부터 고려되어야 하며 연구목적과 연구방법에 의해 정확하게 산출되어야 한다. 표본크기가 적정하지 않게 되면 통계적 유의성을 신뢰할 수 없을 뿐만 아니라 임상적 결과 또한 크나큰 오류를 범하기 .. 2021. 11. 10.
Stable Baselines를 이용한 강화학습(박유성 교수, 자유아카데미) Stable Baselines를 이용한 강화학습(박유성 교수, 자유아카데미) * 머리말 저자는 코딩에 능숙하지 못하지만 파이썬 라이브러리 sklearn 덕분에 큰 어려움 없이 머신러닝을 이해하고 실습할 수 있었으며 Keras나 Pytorch라는 high level 프로그래밍 언어 덕분에 딥러닝을 이해하고 활용할 수 있었다. 강화학습(reinforcement learning)은 인공지능에서 가장 코딩이 복잡하고 난해하여 배우기 어려우나 응용분야가 게임, 금융, 자율자동차, 자율주차, 로봇 등 무궁무진하며, 발전 가능성이 매우 높은 분야이다. 딥러닝과 통계적 추정 방법을 근간으로 하는 강화학습은 40년 이상 통계학만 연구해온 저자에게 정적인 통계학을 동적인 통계학으로 응용할 수 있겠다는 설렘과 호기심으로 다.. 2021. 11. 1.
반응형