Title:

Pair Correlations Preserving Model in Synthetic DataGeneration ; Модель сохранения парных корреляций при генерациисинтетических данных

Author:

Topchyan Vardan ; Топчян Вардан

Type:

Article

Uncontrolled Keywords:

Synthetic data ; Confidentiality ; Disclosure limitation

Abstract:

The risk of disclosure of confidential information increases by the statistical organizations, due to the large volume of data released to the public. The most common methods of limiting the risk of dicloure are synthetic data genaretion methods. Unfortunately, these methods have a heuristic nature, because they do not have a clear theoretical basis. In this work presented a formal model of synthetic data generation for pair correlation preservation.
; Риск раскрытия конфиденциальной информации увеличивается в связи с большим объемом данных, предоставляющимися статистическими организациям и общественности. Наиболее распространенными методами для решения данной проблемы являются методы генерации синтетических данных. К сожалению эти методы имеют эвристический характер, потому что они не имеют четкой теоретической основы. В этой работе представлена формальную модель генерации синтетических данных, обеспечивающих сохранение парных корреляций.

Date submitted:

20.12.2013

Date accepted:

05.03.2014

ISSN:

0131-4645

Language:

English

Journal or Publication Title:

Mathematical Problems of Computer Science

Volume:

41

URL:


Additional Information:

vardan.topchyan@gmail.com

Affiliation:

Institute for Informatics and Automation Problems

Country:

Armenia

Indexing:

ASCI