Benford's law

Creator
Creator
Seonglae ChoSeonglae Cho
Created
Created
2020 Nov 30 3:30
Editor
Edited
Edited
2025 Jan 22 11:53

통계의 많은 항목이 곱셈과 관련이 깊기 때문

Dataset exhibiting scale-invariance and self-similarity driven by power-law relationship
notion image
실세계에서 존재하는 많은 수치 데이터의 10진법 값에서 수의 첫째 자리의 확률 분포를 관찰한 결과, 첫째 자리 숫자가 작을 확률이 크다는 법칙
전기요금 고지서, 도로명 주소, 주식 가격, 주택 가격, 인구수, 사망률, 강의 길이, 물리 상수와 수학 상수 등 다양한 데이터에 등장하는 수들이 벤포드의 법칙을 따른다
인간의 지능지수, 인간의 키 등은 분포한 범위가 아주 좁기 때문에 벤포드의 법칙이 성립하지 않을 가능성이 높다
벤포드의 법칙이 성립하는 "매우 넓은 범위의 데이터"는 보통의 경우 덧셈에 의한 증가가 아니라 곱셈에 의한 증가를 보이는 경우가 많다
임의로 조작하면 완만하게 변한다.
Deepfake
,
Anomaly Detection
  • 1: 30%
  • 2: 17%
  • 9: 5%
 
 

Principle

뻔한 상식을 재단한 ‘벤 포드 법칙’
임의의 자연수를 하나 선택했을 때 첫 자리 수가 1일 확률은 분명히 1/9이다. 그렇다면 실제로 주변의 모든 수치 자료를 모았을 때 그 수들의 첫 자리 숫자가 1일 확률이 1/9일까? 상식적으로 1/9이라고 유추할 것이다. 그러나 △경제 지표들에 나타나는 숫자 △미국의 도로 번호 △회사의 회계 장부 등과 같은 다양한 숫자들을 수집해 맨 앞자리 숫자들을 조사해보면, 첫 자리 수가 1일 확률은 무려 30.1%나 된다고 한다. 이러한 숫자들의 분포를 공식화한 것이 바로 ‘벤 포드 법칙’이다. ‘벤 포드 법칙’의 아이디어는 미국의 천문학자
뻔한 상식을 재단한 ‘벤 포드 법칙’
벤포드의 법칙
벤포드의 법칙(Benford's law)은 실세계에서 존재하는 많은 수치 데이터의 10진법 값에서 수의 첫째 자리의 확률 분포 를 관찰한 결과, 첫째 자리 숫자가 작을 확률이 크다는 법칙이다. 벤포드의 법칙을 따르는 데이터 집합에 등장하는 수들의 첫째 자리가 1일 확률은 약 30%인 데 반해, 9가 첫째 자리로 등장할 확률은 5% 정도밖에 되지 않는다.
벤포드의 법칙

Alphabet Too

Benford’s law and first letter of words
A universal First-Letter Law (FLL) is derived and described. It predicts the percentages of first letters for words in novels. The FLL is akin to Benf…
Benford’s law and first letter of words
namu.wiki
 
 

Recommendations