다항 분포는 여러 개의 값을 가질 수 있는 독립 확률변수들에 대한 확률분포로, 여러 번의 독립적 시행에서 각각의 값이 특정 횟수가 나타날 확률을 정의한다.
다항 분포에서 차원이 2인 경우 이항 분포가 된다.
어떤 시행에서 가지의 값이 나타날 수 있고, 그 값들이 나타날 확률을 각각 라고 할 때, 번의 시행에서 번째 값이 회 나타날 확률은 다음과 같다.
-
이때 이어야 한다. 그렇지 않은 경우의 확률값은 0으로 정의된다.
경우에 따라서, 다항 분포는 값이 나타나는 횟수가 아니라 독립 시행에서 나타나는 값 자체를 가리키기도 한다. 엄밀하게는 이러한 분포는 categorical 분포라고 부르며, 다음과 같이 정의된다. 만약 번째 값이 일 경우,
-
가 된다.