컴북스플랫폼 시즌원. 아티클 서비스
R를 이용한 사회과학데이터 분석 기초편
ISBN : 9791130435848
지은이 : 백영민
옮긴이 :
쪽수 : 364 Pages
판형 : 153*224mm
발행일 : 2015년 4월 24일


책 구매
아티클 보기

 

책 소개
사회과학 연구자의 입장에서 R프로그래밍의 기초 문법을 정리했다. 기본적인 R프로그래밍 명령어를 소개하고, 실제 통계 분석 과정에서 이를 어떻게 활용해야 하는지 설명한다. 프로그래밍 명령어 텍스트와 함께 그 결과 화면을 그림으로 실어 이해도를 높혔다. 책의 예제를 차근차근 따라하다 보면 어느새 R프로그램의 기초를 탄탄하게 다질 수 있을 것이다.

 

※ 부록 - 샘플 데이터 파일을 받으려면 여기를 클릭하세요.

※ 부록 - R commands 파일을 받으려면 여기를 클릭하세요.

※ 부록 - Omnibus_Oct_2012_Political_Video_spss.sav 파일을 받으려면 여기를 클릭하세요.

200자평
R가 SPSS를 대체하는 통계 프로그램으로 떠오른 까닭은 뭔가? 다양한 연구 분야를 포괄하는 범용성 때문이다. 어느 분야에서 활용되나? 통계학, 전산학, 수학, 물리학, 생물학 등 거의 모든 학문 분과에서 사용된다. 사회과학 연구자가 R에 익숙해지려면? 인터넷에 공유된 오픈 소스를 따와 자신의 연구에 직접 적용해 보는 방법이 최선이다. R을 이용해 사회과학 연구를 진행해 온 저자가 R의 기본기를 정리했다. R 프로그램의 활용이 쉬워진다.

지은이 소개
백영민
연세대학교 신문방송학과에서 학사를, 서울대학교 언론정보학과에서 석사를, 미국 펜실베이니아대학교(University of Pennsylvania) 아넨버그스쿨(Annenberg School for Communication)에서 박사 학위를 받았다. 한국과학기술원(KAIST) 조교수를 거쳐 현재 연세대학교 언론홍보영상학부 교수로 재직 중이다. 주 연구 관심사는 수용자 조사와 여론조사, 계량적 연구방법론이다. Journal of Communication, Communication Research, New Media & society, Journal of Broadcasting and Electronic Media, ≪한국언론학보≫ 등 여러 학술지에 논문을 게재했다. 역서로 『수용자 진화』(2013, 공역), 『국민의 선택: 대통령 선거 캠페인 기간 유권자는 지지 후보를 어떻게 결정하는가』(2015)가 있다.
https://sites.google.com/site/ymbaek/

차례
머리말

 

1부 들어가면서

01 사회과학자는 왜 프로그래밍을 배워야 하는가?
02 언어 학습으로서 R프로그래밍
03 예술 작업으로서 R프로그래밍
04 객체 지향 프로그래밍
05 R프로그래밍을 위한 마음가짐
06 R프로그램 설치

 

2부 데이터 관리

07 데이터란
08 데이터 입력하기와 불러오기
데이터의 직접입력
외부 데이터 불러오기
09 데이터의 통합과 분석
10 데이터 관리: 요점 정리

 

3부 데이터 사전처리

11 데이터 중 일부만 골라내기
데이터 중 일부 변수 취하기
데이터 중 일부 사례만 취하기
집단수준의 통계치로 집산된 데이터세트
12 변수 관리
결측값 처리
역코딩하기
리코딩하기
요인으로 전환

 

4부 통계분석

13 R프로그래밍을 통한 확률분포 학습
사회과학에서 자주 등장하는 확률분포
R프로그래밍으로 살펴본 중심극한정리
14 단일변량 기술통계분석
변수의 기초 정보
변수의 중심치 관련 통곗값
변수의 변이 관련 통곗값
15 다변량 추리통계분석
t-검증
카이제곱 검증
상관관계 분석
분산분석
다변량 일반회귀분석
로지스틱 회귀분석
신뢰도 분석
주성분 분석과 탐색적 인자분석

 

5부 기초편을 넘어

16 기초가 가장 중요하다
17 응용편과 고급편: 간단한 소개

책 속으로
이 책은 R를 소개하는 기존의 책과 매우 다른 접근을 취했다. R에 관한 기존의 책들은 대부분 통계학 전공자들이나 컴퓨터 프로그래머와 같은 사람들이 저술하였다. 이러한 배경을 갖는 사람들이 보기에 이 책에서 소개된 R프로그래밍은 비효율적으로(inefficient) 보일 수 있다. 이를테면 이 책에서는 attach()와 detach()함수를 사용하지 않았는데, 이 같은 비효율성은 사실 의도된 것이다. 비효율성을 택한 대신 저자는 프로그래밍에 익숙하지 않은 사람들이 보아도 이해할 수 있는 반복적이지만 직관적인 프로그래밍을 강조하였다. 이 책의 독자들 중 반복적이라도 직관적인 R프로그래밍보다 효율적인 R프로그래밍을 원한다면, 다른 R 관련 책을 탐독하는 편이 나을 것이다. 하지만 대부분의 사회과학 데이터의 크기가 크지 않은 상황과 최근 컴퓨터의 자료처리 속도를 감안할 때, 비효율적이지만 직관적으로 이해가 가능한 프로그래밍이라도 자료를 처리하는 데는 많은 시간이 낭비되지 않는다는 점을 강조하고 싶다.
_ <머리말> 중에서

 

일반 상업용 프로그램에서의 프로그래밍과 R의 프로그래밍은 얼마나 다를까? 의심의 여지없이 일반 상업용 프로그램은 사용이 쉽다. 그러나 사용이 쉬운 대신, “뜻을 실어 펼” 표현법이 부족하다는 문제가 있다. 비유를 하자면 상업용 프로그램의 프로그래밍은 아이콘(icon)을 이용한 커뮤니케이션과 비슷하다. 아이콘을 이용한 커뮤니케이션은 그림을 통해 특정한 정보를 쉽게 커뮤니케이션할 수 있다는 장점이 있다. 하지만 아이콘을 이용해 커뮤니케이션되는 표현은 단순한 것에 그치기 쉽다. 이에 반해서 R프로그래밍은 추상적 언어에 보다 가깝다. 외국어를 배울 때 어려움을 겪듯, 프로그래밍을 접해 보지 않은 사회과학자의 입장에서 R프로그래밍은 쉽지 않은 것이 사실이다. 게다가 ‘R프로그래밍에 익숙해 봤자 사회과학적 지식 추구에 직접적으로 도움이 되지 않는 것’처럼 보이는 것도 사실이다. 그러나 확실한 것은 R프로그래밍은 매우 유연한 언어이기 때문에 기초적인 데이터 관리 및 분석에서 고급 분석 방법까지 커버가 가능하다는 점이다.
_ <02 언어 학습으로서 R프로그래밍> 중에서