The risk of disclosure of confidential information increases by the statistical organizations, due to the large volume of data released to the public. The most common methods of limiting the risk of dicloure are synthetic data genaretion methods. Unfortunately, these methods have a heuristic nature, because they do not have a clear theoretical basis. In this work presented a formal model of synthetic data generation for pair correlation preservation.
;
Риск раскрытия конфиденциальной информации увеличивается в связи с большим объемом данных, предоставляющимися статистическими организациям и общественности. Наиболее распространенными методами для решения данной проблемы являются методы генерации синтетических данных. К сожалению эти методы имеют эвристический характер, потому что они не имеют четкой теоретической основы. В этой работе представлена формальную модель генерации синтетических данных, обеспечивающих сохранение парных корреляций.
oai:noad.sci.am:135935
Mathematical Problems of Computer Science
Institute for Informatics and Automation Problems
Mar 4, 2021
Jul 27, 2020
23
https://noad.sci.am/publication/149528
Edition name | Date |
---|---|
Vardan Topchyan, Pair Correlations Preserving Model in Synthetic DataGeneration | Mar 4, 2021 |