| 머리말 이 책은 필자가 지난 10년간 대학에서 통계 분석에 관한 교과목을 가르쳐 오면서 느꼈던 점들을 보완하여 하나의 교재로 만들어 본 것이다. 따라서 대학의 교양 과정이나 사회 과학 분야에서 통계학이나 응용 통계 분석의 학습 교재로 이 책을 사용할 수 있을 것이다. 이 책의 두드러진 특징은 가급적 많은 설명을 통하여 일반인들도 독습(獨習)을 할 수 있도록 저술하려 하였다는 점과 기초 통계 분석에서 다루는 통계 기법과 항목은 가급적 모두 실으려 했다는 점이다. 또한 한글 세대를 위해 한자는 모두 괄호 안에 넣어 책을 읽는 데 불편함이 없도록 하였다. 이러한 점에서 일반인들이 수학에 관한 깊은 지식이 없더라도 이 책을 통해 통계 분석에 대한 이해와 응용이 어느 정도는 가능하리라고 본다. 이러한 목적으로 집필을 하다 보니 대학에서 한 학기에 가르칠 수 있는 분량으로는 너무 많아지게 되었다. 만약 한 학기에 강의를 하게 되는 경우는 강의를 맡은 분이 교과목적에 따라 선택적으로 가르칠 수밖에 없을 것이라고 생각된다. 두 학기에 나누어 가르칠 경우에는 제1부부터 3부까지를 첫 학기에 다루고, 나머지를 다음 학기에 다루면 될 것이라고 본다. 막상 탈고를 하고 보니 부족한 점이 한두 가지가 아니다. 좀더 체계적으로 컴퓨터에 사용할 수 있는 통계 패키지를 통해 통계 분석에 대한 이해를 더하는 데에도 미흡하였고, 강의를 위해 각 장의 분량을 배정하는 데에도 미흡하다는 생각이 든다. 또한 숫자만 나오면 질겁을 하는 인문계 성향의 독자가 부담이 없이 읽어낼 수 있는 책을 만드는 데에도 미흡하였다는 생각이 든다. 여러 가지 생각을 품고 쓰기 시작하였지만 정작 원고를 정리하고 보니 정말 부족한 점이 한두 가지가 아니다. 독자들의 힐책(詰責)을 달가이 받고자 한다. 그러함에도 만용을 부려 이 책을 발간하게 된 데에는 그만한 이유가 있다. 사실 이 책의 원고가 완성된 것은 벌서 여러 해 전의 일이며, 이 책의 원고를 가지고 계량 분석 또는 통계 분석에서 가르친 지도 몇 해가 지났다. 그러나 필자의 게으름과 소심함으로 이 책의 발간을 차일 피일 미루어만 왔었다. 그러다가 이 책의 출간을 흔쾌히 맡아 준 대영문화사 임춘환 사장의 성화와 같은 독촉에 더 이상 견딜 재간이 없게 되었다. 필자의 부족함에도 불구하고 지난 6년 이상을 계속하여 독려해 준 임사장에게는 정말 사랑의 빚을 진 셈이다. 또한 필자의 곁에서 같은 학문의 길을 걸으며 박사 과정을 마친 제자 임경환군의 도움도 빼놓을 수 가 없을 것이다. 임군은 학부에서 강의 하며 이 책의 원고를 가편집하여 필자에게 무언의 압력을 넣었는가 하면, 일방적으로 대영문화사에 원고를 넘겨 주어 필자로 하여금 출간을 하지 않을 수밖에 없는 지경에 빠뜨린 것이다. 워낙 게으른 필자로서는 임군이 없었다면 이 책의 원고는 아마 사장(死藏)되었을는지도 모른다. 원고의 교정부터 출간까지 자신의 일처럼 헌신적으로 일해 준 임군에게도 적지 않은 빚을 진 셈이다. 그러고 보니 이 책이 출간될 때까지 음양으로 적지 않은 도움을 준 은사님, 선배, 동료, 후학, 제자들의 모습이 주마등처럼 지나간다. 여기서 이들을 모두 언급한다는 것은 오히려 누가 될지도 몰라 굳이 언급하지는 않고자 한다. 그렇다 하더라도 필자에게 통계 분석에 대한 새로운 안목을 가지게 도와 주었던 미국 펜실베니아대학교의 Russel L. Ackoff, Edward J. Lusk, Jean-Marc Choukroun, David K. Hildebrand 교수님들의 가르침을 빼어 놓을 수는 없을 것 같다. 이분들께 이 자리를 빌려 진솔된 감사함을 드린다. 누구나 그렇겠지만 책이 출간될 때까지 가족의 희생에 대해 미안한 마음은 아무도 부정할 수 없을 것이다. 아내 영옥과 수나, 재은, 미나에게 이 책이 조금이라도 위안이 되길 빌 뿐이다. 특히 못난 아들을 늘 믿고 지원해 주신 어머님과 작고하신 아버님께도 이 지면을 통해 고마운 마음 조금이라도 드리고 싶다. 수년 전 원고를 처음 작성할 때에 힘들다는 이야기 한 마디 하지 않고 헌신적으로 문서 편집을 해 주었던 딸 혜란에게는 이제야 그 빚을 갚는 것 같아 홀가분한 마음이다. 끝으로, 복잡한 수식이 많은 책을 아름답게 꾸며 준 대영문화사 여러분에게도 감사드린다. 비록 부족한 점이 많지만 아무쪼록 독자에게 조금이나마 유익한 책이 되기를 비는 마음 간절할 뿐이다. 비룡탑을 바라보며 무인년 겨울에 저자 씀 차 례 제1부 통계 자료의 정리와 기술 제1장 서론 1. 통계와 통계학 2. 통계 모형과 통계 분석 3. 통계 분석에서의 주요 개념 1) 모집단과 표본 2) 변수 (1) 이산 변수와 연속 변수 (2) 파생 변수 (3) 독립 변수와 종속 변수 4. 통계 자료의 정확성과 측정의 오차 1) 허위 통계 2) 정확성과 정밀성 3) 올림과 내림 4) 오차 5. 측정의 수준과 통계 자료의 종류 1) 명목 척도에 의한 자료 2) 순위 척도에 의한 자료 3) 구간 척도에 의한 자료 4) 비척도에 의한 자료
제2장 자료의 정리와 기술 1. 중심 경향의 측정 1) 최빈수 2) 중위수 3) 산술 평균 4) 가중 산술 평균 5) 단순 조화 평균 6) 가중 조화 평균 7) 단순 기하 평균 8) 가중 기하 평균 2. 절대 산포의 측정 1) 범위 2) 4분위간 범위 3) 4분편차 4) 분산과 표준 편차 3. 상대 산포의 측정 4. 꼴의 측정 1) 비대칭도의 측정 2) 첨도 5. 도표로 정리된 자료의 기술 1) 도수 분포 2) 도수 분포의 작성 3) 그림으로 표현하기 (1) 기둥그림표 (2) 도수 다각형 (3) 누적 도수 분포 4) 중심 경향과 산포도의 측정 (1) 최빈수 (2) 중위수 (3) 산술 평균 (4) 분산과 표준 편차 6. 적률의 개념과 활용 1) 적률의 기본 개념과 공식 2) 적률간의 관계 3) 무차원적 적률 4) 대칭도와 첨도의 계산 5) 적률의 연습 부록 2-1 : 합산 기호 연습 부록 2-2 : 로그의 기초 개념과 계산법
제2부 확률과 확률 분포 제3장 확률의 기초 개념 1. 확률의 의의 1) 확률의 의미 2) 객관적 확률 (1) 동등 확률 사상 (2) 상대 빈도 3) 주관적 확률 2. 집합, 확률 변수, 확률 1) 집합과 사상 (1) 집합의 의미 (2) 집합의 연산 2) 확률 변수와 함수 (1) 확률 변수 (2) 집합과 함수 (3) 표본 공간 3. 확률의 주요 공리와 정리 1) 확률의 기본 공리 2) 확률의 정리 (1) 더하기의 특별 규칙 (2) 더하기의 일반 규칙 (3) 곱하기의 특별 규칙 (4) 조건 확률 (5) 곱하기의 일반 규칙 (6) 제거의 규칙 3) 베이스(Bayes)의 정리와 확률의 수정 4. 수학적 기대 부록 3-1 : 순열과 조합 부록 3-2 : 독립성과 상호 배타성
제4장 이산 확률 분포 1. 이항 확률 분포 1) 계산 방법 2) 이항 확률 밀도 함수 3) 이항 확률의 분포 4) 이항 확률(분포)표 5) 이항 확률이 0.5 이상인 경우 6) 이항 분포의 기술적 측정량 2. 푸아송 확률 분포 1) 이항 분포와 푸아송 분포 2) 푸아송 확률의 표 3. 초기하 확률 분포 1) 기본 개념 2) 이항 확률과 초기하 확률 4. 부의 이항 분포 1) 부의 이항 확률의 성격 2) 이항 확률과 부의 이항 확률
제5장 연속 확률 분포 1. 표본 공간, 확률 및 연속 변수 2. 균일 분포 3. 정규 분포 1) 이항 분포의 극한으로서의 정규 분포 2) 정규 확률 3) 정규 분포에 의한 이산 확률 분포의 근사화 (1) 정규 확률과 이항 확률 (2) 정규 확률과 푸아송 확률 (3) 정규 분포의 중요성 4. 지수 분포 1) 지수 분포의 성격 2) 지수 확률 5. 각종 확률 분포의 비교
제3부 표본 추출의 이론과 실제 제6장 표본 분포와 추정 1. 확률 표본 추출과 난수표의 사용 1) 단순 확률 표본 추출 2) 난수표 (1) 난수표 (2) 몬테 카를로 방법 2. 표본 통계의 분포 1) 표본 평균의 분포 2) 큰 수의 법칙 3) 표본 중위수의 분포 4) 표본 표준 편차의 분포 (1) 모집단 퍼짐 추정에 대한 편의의 보정 (2) 평균의 표준 오차에 대한 불편 추정 5) 표본 비율의 분포 (1) 표본 비율의 분포의 특성 (2) 비율의 표준 오차의 분편 추정치 3. 무한 모집단 모수의 측정 1) 점 추정치 (1) 좋은 추정량의 속성 (2) 표본 특성, 모수, 추정량의 요약 2) 구간 추정 (1) 평균에 대한 구간 추정 (2) 모집단 비율에 대한 구간 추정 (3) 모집단 백분율에 대한 구간 추정 4. 작은 표본과 t분포 1) t분포 2) 작은 표본의 평균에 대한 구간 추정 5. 구간 추정과 표본의 크기 1) μ의 구간 추정에 대한 표본의 크기 2) π의 구간 추정에 대한 표본의 크기 6. 유한 모집단 모수의 추정 1) 유한 승수 2) 유한 모집단의 평균에 대한 구간 추정 3) 유한 비율에 대한 구간 추정 7. 통계적 품질 관리 1) 변이의 종류 2) 변수에 대한 관리도 (1) 표본 평균에 대한 관리도 (2) 범위에 대한 관리도 3) 특성에 대한 관리도 (1) 불량 비율에 대한 관리도 (2) 불량비에 대한 통제표
제7장 표본 설계 1. 표본 추출의 원칙과 용어 1) 정밀성과 정확성 2) 모집단의 정의 3) 단순 확률 표본 추출의 문제점 2. 표본 설계의 효율성 증가 3. 층화 표본 추출 1) 층화 표본 추출의 성격 2) 층화 표본 추출을 위한 구간 추정 (1) 층의 평균 (2) 층의 분산 (3) 층화 표본의 평균 (4) 층에 대한 표본 평균의 분산 (5) 층화 표본에 대한 평균의 표준 오차 (6) 모집단 평균에 대한 신뢰 구간 3) 최적 배분 (1) 고정 비용하의 최적 배분 (2) 변동 비용하의 최적 배분 4. 군집 표본 추출 1) 군집 표본 추출의 성격 2) 군집 표본 구간 추정 (1) 군집 표본의 평균 (2) 군집내 분산 (3) 군집간 분산 (4) 군집 표본에 대한 평균의 표준 오차 (5) 모집단 평균에 대한 신뢰 구간 3) 최적 배분 5. 다른 표본 설계 1) 층화 군집 표본 추출 2) 체계적 표본 추출 3) 자의적 표본 추출 4) 합격 판정 / 연속 표본 추출 | 제4부 통계적 추론 제8장 표본 평균과 비율에 대한 유의차 검정 1. 의사 결정에 대한 통계적 접근 1) 자연 상태 2) 자연 상태에 대한 가설 3) 행동을 결정하는 의사 결정 규칙 4) 오류의 종류 5) 잘못된 결정을 내릴 확률 (1) 제1종 오류의 확률 (2) 제2종 오류의 확률 6) 단측 검정과 양측 검정 2. 유의차 검정 실시 단계 3. 단순 표본 평균의 검정 1) 모집단의 표준 편차가 알려져 있을 때 2) 모집단의 표준 편차가 알려져 있지 않을 때 4. 두 표본 평균간의 차이에 대한 검정 1) 모집단의 표준 편차가 알려져 있을 때 2) 모집단의 표준 편차가 알려져 있지 않을 때 3) 종속 관찰치의 비교 5. 단순 표본의 비율 검정 1) 작은 표본의 유의차 검정 2) 큰 표본의 유의차 검정 표본 6. 큰 두 표본의 비율 차이에 대한 검정
제9장 비모수 검정 1. 카이 자승 분포 1) 적합성 검정 (1) 균일 분포 (2) 푸아송 분포 (3) 정규 분포 2) 독립성 거정 (1) 2×2 분할표 (2) r×c 분할표 3) 동질성 검정 2. 콜모고로프-스미르노프 단표본 검정 3. 부호와 순서를 이용하는 검정 1) 부호 검정 2) 윌콕슨 부호 순위 검정법 3) 맨-휘트니 U검정 4) 크루스칼-윌리스 H검정 4. 무작위성 검정
제10장 분산 분석 1. 표본 분산의 유의도 검정과 신뢰 한계 1) 표본 분산에 대한 유의도 검정 2) 모집단 분산의 신뢰 구간 2. F분포 1) F통계량의 분포 2) F유의값의 표 3. 두 분산에 대한 유의도 검정 4. 표본의 수가 동일할 때 일원 분산 분석 1) 자료의 짜임새 2) 모형 3) 가설 4) 표본 평균의 퍼짐에 기초한 모집단 분산의 추정 5) 표본 관찰값의 퍼지에 기초한 모집단 분산의 추정 6) 분산 분석표 7) 계산 공식 8) 다른 계산 공식 5. 표본의 수가 다를 때 일원 분산 분석 1) 분산 분석표 2) 계산 공식 6. 방안당 하나의 관찰치가 있을 때의 이원 분산 분석 1) 자료의 짜임 (1) 이질적인 실험 단위 (2) 구획의 설정 (3) 처리의 확률화 2) 모형 3) 가설 4) 분산 분석표 5) 계산 공식 7. 방안당 n개의 관찰치가 있을 때의 이원 분산 분석 1) 자료의 짜임 2) 모형 3) 가설 4) 분산 분석표 5) 계산 공식 8. 라틴 정방형 분석 1) 자료의 짜임 2) 모형 3) 가설 4) 분산 분석표 5) 계산 공식 9. 정규 분포, t분포, 분포, F분포 간의 관계 1) z값과 F값의 비교 2) t분포와 F분포의 비교 3) χ²값과 F값의 비교 10. 다중 비교 방법 1) 최소 유의차 방법 2) HSD 검정 방법 3) 셰페의 비교 방법
부록 10-1 : 분산 분석에서 총 자승합의 분해
제5부 회귀 및 상관 분석 제11장 회귀 분석과 상관 관계 : 선형 이원 변량 분석 1. 연관에 의한 분석 1) 분류에 의한 연관 분석 2) 평균 관계의 선 3) 연관과 인과 관계 2. 선형 회귀 분석 1) 함수 관계 2) 이원 변량 관계 (1) 도표로 나타내기 (2) 점의 산포와 변수간의 관계 3) 회귀선 (1) 기본 성질 (2) 표본 자료로부터 모수 추정 (3) 추정 표준 오차 (4) 추정 표준 오차의 불편 추정 4) 추정된 회귀선과 연관도니 표본 오차 (1) b의 표본 오차 (2) Y 추정값의 표준 오차 3. 상관 분석 4. 일반 상관 계수 5. 상관 관계와 표본 추출 이론 1) 표본 상관 계수 2) r과 b와의 관계 3) r의 유의도 검정 6. 순위 상관 부록 11-1 : 단순 회귀 분석의 실례와 해석 부록 11-2 : 최소 자승법
제12장 비선형 회귀 분석과 다중 회귀 분석 1. 곡선 쌍변인 회귀 분석 1) 다항 회귀 모형 2) 이차 다항 회귀 모형 (1) 최소 자승법과 다항 회귀 (2) 추정치의 추정 표준 오차 3) 다항 회귀선 추정을 위한 컴퓨터 이용 (1) 고차원 다항식을 위한 일반 공식 (2) 다항 회귀 공식을 선택하기 위한 방법 4) 이원 변량 회귀에서의 변환 (1) 지수 회귀 (2) 다른 변환 2. 곡선 쌍변인 상관 1) 다항 상관 (1) 이차 다항 상관 (2) 고차 다항 상관 (3) 결정 지수의 유의검정 (4) 다항 회귀 공식 선택의 다른 방법 2) 지수 상관 3. 연관에 의한 다변인 분석 1) 다변인 분석의 기호 2) 연관에 의한 분석 4. 중변인 회귀 1) 중변인 회귀 공식 2) 중변인 회귀의 추정 3) 쌍변인 회귀와 중변인 회귀의 비교 4) 중변인 회귀의 표본 오차 5. 중변인 상관 관계 1) 다중 결정 계수 2) 다중 결정 계수에 대한 유의도 검정 6. 부분 상관 1) 영차 및 일차 부분 계수 2) 부분 결정 계수와 다중 결정 계수의 비교 7. 다중 변인 회귀 분석과 상관 분석 1) 네 변수의 회귀 분석 2) 네 변수 이상의 다중 상관 관계 (1) 결정 계수 (2) 다중 결정 계수의 유의도 검정
제6부 시계열 분석 제13장 시계열 분석 1. 분석의 문제 2. 고전적 접근 1) 시계열의 구성 요소 2) 시계열 모형 3. 경향 1) 선형 경향 2) 비선형 경향 (1) 지수 경향 공식 (2) 예측 모형의 비교 (3) 다항 경향 공식 (4) 성장 곡선 4. 계절 변동 5. 순환 변동 6. 오차 변동 7. 시계열 예측 1) 판단 예측 2) 경향 예측 3) 순환 예측 4) 회귀분석 예측 5) 박스-젠킨스 예측 방법 6) 지수 평활법 7) 예측의 실행 |
저자약력 이 준 형 - 인천 출생 - 서울대학교 농과대학 (농학사) - 서울대학교 행정대학원 (행정학 석사) - 미국 University of Pennsylvania Wharton School (Social Systems Science 박사) - 인하대학교 국제협력실장, 사무처장 역임 - 한국행정학회, 한국정치학회, 한국정책분석평가학회, 관악행정학회, 한국정책학회 회원 - 현 인하대학교 행정학과 부교수 저서 및 논문 - 새행정학(공저) - “문제의 맥락과 연구스타일”외 논문 다수 |