확률론에서 누적분포함수(累積分布函數, 영어: cumulative distribution function, 약자 cdf)는 주어진 확률 변수가 특정 값보다 작거나 같은 확률을 나타내는 함수이다.
확률 공간 위의 실숫값 확률 변수 의 (우연속) 누적분포함수 는 다음과 같다.
-
보다 일반적으로, 확률 공간 위의 실숫값 확률 벡터 의 (우연속) 누적분포함수 는 다음과 같다.
-
위 정의에 등장하는 반닫힌구간들을 열린구간으로 대체하면 좌연속 누적분포함수의 정의를 얻는다.
임의의 함수 에 대하여, 다음 두 조건이 서로 동치이다.
- 는 어떤 확률 변수의 누적분포함수이다.
- 다음 조건들을 만족시킨다.
- (증가 함수) 만약 이며 라면,
- (우연속 함수) 임의의 에 대하여,
-
-
여기서 는 우극한이며, 와 는 음과 양의 무한대에서의 극한이다.
보다 일반적으로, 임의의 함수 에 대하여, 다음 두 조건이 서로 동치이다.
- 는 어떤 확률 벡터의 누적분포함수이다.
- 다음 조건들을 만족시킨다.
- 만약 이며 이라면, . (이 조건과 세 번째 조건은 가 각 변수에 대하여 증가 함수임을 함의한다.)
- (우연속 함수) 임의의 에 대하여,
- 임의의 및 에 대하여,
-
여기서
-
-
-
이다.
확률 변수 또는 확률 벡터의 누적분포함수는 그 확률 분포를 유일하게 결정한다. 이는 누적분포함수에 대한 르베그-스틸티어스 측도와 일치한다. 그러나 누적분포함수는 확률 변수 자체를 유일하게 결정하지는 않는다.
확률 변수 가 구간 에 속할 확률과 특정 실수 를 취할 확률은 누적분포함수 를 통해 각각 다음과 같이 나타낼 수 있다.
-
-
보다 일반적으로, 확률 벡터 가 에 속할 확률과 특정 값 을 취할 확률은 각각 다음과 같다.
-
-
확률 변수 에 대하여, 다음 두 조건이 서로 동치이다.
- 는 이산 확률 변수이다. (즉, 인 가산 집합 이 존재한다.)
-
특히, 계단 함수를 누적분포함수로 하는 확률 변수는 이산 확률 변수이다. 그러나 그 역은 성립하지 않는다.
확률 변수 에 대하여, 다음 두 조건이 서로 동치이다.
- 는 연속 확률 변수이다. (즉, 임의의 에 대하여, 이다.)
- 는 연속 함수이다.
확률 변수 에 대하여, 다음 두 조건이 서로 동치이다.
- 는 절대 연속 확률 변수이다. (즉, 확률 분포 는 르베그 측도에 대한 절대 연속 측도이다. 또는, 는 확률 밀도 함수를 갖는다.)
- 는 임의의 닫힌구간에서 절대 연속 함수이다.
확률 변수 에 대하여, 다음 두 조건이 서로 동치이다.
- 는 특이 확률 변수이다. (즉, 확률 분포 와 르베그 측도는 서로 특이 측도이다.)
- 르베그 거의 어디서나 이다.
임의의 누적분포함수 는 이산 누적분포함수 와 절대 연속 누적분포함수 , 특이 연속 누적분포함수 의 음이 아닌 계수의 아핀 결합으로 나타낼 수 있다.
-
-
-
같은 확률 공간 위의 확률 변수 또는 확률 벡터들의 집합 에 대하여, 다음 두 조건이 서로 동치이다.
- 는 서로 독립이다.
- 임의의 서로 다른 및 임의의 ( )에 대하여,
첫 번째 조건은 두 번째 조건을 자명하게 함의한다. 이제 두 번째 조건을 가정하고 첫 번째 조건을 증명하자. 유한 개의 확률 변수
-
-
의 경우의 증명은 다음과 같다. 일반적인 경우는 이와 유사하게 증명할 수 있다.
-
라고 하자. 그렇다면 는 π계를 이루며, 는 를 포함하는 최소의 시그마 대수이다. 다음과 같은 집합을 생각하자.
-
그렇다면, 가정한 조건에 따라 이다. 또한, 은 λ계를 이룸을 보일 수 있다. 딘킨 π-λ 정리에 따라, 이다. 이제, 다음과 같은 집합을 생각하자.
-
그렇다면, 이므로 이며, 은 λ계를 이룬다. 따라서 이다. 이와 같은 과정을 반복하면 결국 임의의 에 대하여,
-
이라는 사실을 얻는다. 즉, 은 서로 독립이다.