1. 공분산과 상관계수- 산점도 : 두 수치 변수 간에 관계가 있는지를 시작적으로 확인- 두 수치변수 간에 직선관계가 어느 정도인지를 나타내는 통계값 -왼쪽 사진은 x축이 커지면 y축이 커짐 > 양의 관계-오른쪽 사진은 x축이 커지면 y축이 작아짐 > 음의 관계 *고려사항-왼쪽 그림 : $(\overline{x},\overline{y})$(평균)를 중심으로 1과 3사분면에 자료가 많고 길게 분포 > 양수로 표시-오른쪽 그림 : $(\overline{x},\overline{y})$(평균)를 중심으로 2와 4사분면에 자료가 많고 길게 분포 > 음수로 표시$(x_i-\overline{x})(y_i-\overline{y})$평균에서 멀어질 수록 직선관계가 명확해짐(값이 커짐) 2. 표본공분산(sample co..
분류 전체보기
·JAVA
1. 상수 상수 : 변하지 않는 값 상수를 선언 : final 키워드 사용 package first; public class Helloworld { public static void main(String[] args) { final int MAX_NUM = 100; final float PI = 3.14; PI = 3.15 } } PI의 값은 변하지 않음, 오류 발생 2. 리터럴 : 프로그램에서 사용되는 모든 숫자, 값, 논리 값 (ex. 10, 3.14, 'a', true) -리터럴에 해당되는 값은 특정 메모리의 공간인 상수 풀에 있음 -필요한 경우 상수 풀에서 가져와 사용 -상수 출에 저장할 때 정수는 int, 실수는 double로 저장 -따라서 long이나 float 값으로 저장해야 하는 경우 식별..
·JAVA
package first; public class Helloworld { public static void main(String[] args) { int num = 10; //10진수 int bNum =0B1010; //2진수 int oNum = 012; //8진수 int hNum = 0XA;//16진수 System.out.println(num); System.out.println(bNum); System.out.println(oNum); System.out.println(hNum); } }
출처 : k-mooc 여인권 교수님, 통계학의 이해11.산포(dispersion, 퍼짐) -자료들이 얼마나 퍼져 있는지를 나타내는 측도 -중심위치가 얼마나 안정적인지에 대한 중요한 정보를 제공◦ 자료가 조밀하게 모임 ⇒ 중심위치의 변동성이 작아짐◦ 자료가 넓게 퍼짐 ⇒ 중심위치(평균)의 변동성이 커짐1) 범위(Range)-자료 중 가장 큰 값과 작은 값의 차이 범위 $$범위 = x_n-x_1-ex 취업률 자료에서 최고 취업률은 91.3%이고 최저 취업률은19.6% ⇨ 범위: 91.3% - 19.6% = 71.7%-최대값과 최솟값에만 영향을 받아 자료 전체의 퍼져 있는 정도 파악 불가2) 사분위(간) 범위(Interquartile-Range)-사분위수(quartile) : 자료를 동일한 비율로 4등분 할 ..
출처 : k-mooc 여인권 교수님, 통계학의 이해1 1. 표본중앙값(sample median, 표본중위수)- 자료를 크기순서대로 나열했을 때 중간에 있는 값- 순서통계량(order statistics): 표본을 오름차순으로 정렬한 것$$(x_1ex) 8명의 졸업생의 월급 자료 225, 230, 240, 265, 265, 270, 275, 500-표본 중앙값은 $$ (265+265)/2 = 265 $$- 표본 중앙값은 극단적인 값에 영향을 받지 않음- 이상점의 유무에 관계없이 안정적인 중심위치 제공 > 이상점에 로버스트 함- 중앙에 있는 하나 또는 두 개의 값만 사용되므로 자료의 정보를 다 활용하지 못함 2. 중심위치의 사용 (평균과 중앙값 중)-평균과 중앙값 중에서 평균이 중앙값과 유사하다면 평균을 사..
출처 : k-mooc 여인권 교수님, 통계학의 이해11. 중심위치 1) 표본평균(1)무게중심이란 -일정한 점을 기준으로 양쪽의 거리가 같게 하는 그 점을 무게중심이라고 함 -평균은 일정 값들의 중심이 됨-즉 평균 = 무게중심(2)표본비율 ex)8명의 월급 실수령액250, 275, 260, 265, 265, 270, 400, 235 8명의 수령액 합은 2220만원평균은 2220/8 = 277.5*이상점 -자료 중 400만원ㅇ이라는 값이 다른 자료와 큰 차이가 있어 평균이 커짐-무게 중심으로써 제대로 된 역활을 하지 못함-대부분의 관측값으로 부터 멀리 떨어져 있는 일부 관측값을 이상점이라고 함-이상점의 포함 여부에 따라 표본평균 값에 차이가 크게 남 > 이상점에 로버스트(robust) 하지 않음*이상점이 있..
출처 : k-mooc 여인권 교수님, 통계학의 이해1 1. 범주화: 계급의 수와 경계값(크기) 결정-계급수 수 결정 :제곱근 방법, Sturges 공식, Rice 공식 등의 공식을 이용하여 분석자가 자료의 특성을 고려하여 결정-계급경계 : 간격(크기)과 시작점과 끝점을 지정. 기본적으로 동일 간격이고 자료의 구조와 설명을 고려해 선택. -50% 이상 취업률을 가지는 학과의 비중 : 1-0.214 = 0.786 (78.6% 학과가 50% 이상의 취업률을 가지는 학과) 2. 그래프를 이용한 자료정리 1) 점도표(dot plot):각 관측값의 우치에 점을 표시하고 같은 관측값이 있는 경우 위로 누적 2) 히스토그램: 수치자료를 특히 연속자료으 분포형태를 표시-계급의 상대도수를 사각형의 면적으로 표시 3) 줄..
출처 : k-mooc 여인권 교수님, 통계학의 이해11. 도수 분포표(Frequency table): 각 범주에 몇 개의 관책개체가 있는지를 정리한 표-도수(frequency) :범주에 속한 관측개체의 수(=빈도)-상대도수(relative frequency) : 전체 자료 중 해당 범주에 속한 자료의 비율 2. 원도표:원에 각 범주에 해당되는 비율만큼 각도를 분할하여 표시-해당 범주의 각도 = 비율 x 360도-원을 사용하는 이유는 각 범주의 각도의 면적의 비가 항상 동일하기 때문(1/4만큼 그어지면 그것이 면적의 1/4) 3. 막대그래프-차이에 대한 인지 순서: 동일한 척도에서의 위치, 길이, 각도와 기울기, 면적, 부피, 색상과 밀도 순-각 범주의 도수나 상대도수를 막대의 길이로 표시한 그림-동일한 ..
출처 : k-mooc 여인권 교수님, 통계학의 이해1자료의 종류와 특성-통계분석 방법은 자료의 속성과 분석 목적에 따라 달라짐-분석방법의 적절성 : 분석하고자 하는 자료가 분석방법에서 가정한 조건을 어마나 만족하는지에 따라 결정 -> 자료의 속성에 따른 분류 필요 1.변수(variable)-일변량 자료(univariate data): 하나의 변수만 있는 자료 -다변량 자료(multivariate data): 여러 개의 변수로 이루진 자료 ∙ ->변수들 간 관련성 유무 2. 관측개체(observation, 관측값(치)) -관측개체들 간 관련성 3. 자료의 분류 1) 범주형 자료 (1)명목형 자료(nominal data) :숫자로 바꾸어도 그 값이 크고 작음을 나타내느 것이 아니라 단순히 범주..
출처 : k-mooc 여인권 교수님, 통계학의 이해11. 확률표본추출 : 모집단을 구성하는 모든 추출단위에 대해 표본으로 추출된 확률을 알 수 없는 추출법 1) ex. 모집 1,2,3,4,5 에서 두 개의 표본이 뽑힐 확률 :2/5 2) 종류단수확률추출, 계통추출, 집락추출, 층화확률추출 등 3) 특징튿정한 표본이 선정될 확률을 토대로 추정오차를 과학적으로 설명 가능 4) 확률표본추출방법 (1) 단순확률추출 (simple random sampling) - 크기가 N인 모집단에서 크기 n인 표본을 무작위로 추출 - 모든 단위들이 표본에 선택될 확률이 동일 - 실제 대규모 조사에서 거의 사용되지 않지만 다른 모든 표본추출방법의 기초가 됨 (2) 계통추출(systematic sampling)..