Կոնֆիդենցիալ տեղեկատվության բացահայտման ռիսկը մեծանում է ի շնորհիվ վիճակագրական կազմակերպությունների կողմից հանրությանը տրամադրվող մեծ քանակությամբ տվյալների: Այս խնդիրի լուծման ամենատարածված մեթոդներից են սինթետիկ տվյալների գեներացումը: Ցավոք, այդ մեթոդներն ունեն էվրիստիկ բնույթ, քանի որ նրանք չունեն հստակ տեսական հիմնավորում: Այս աշխատանքում ներկայացված է սինթետիկ տվյալների գեներացման ֆորմալ մոդելը, որն ապահովում է զույգ կորելյացիաների պահպանությունը:
;
Риск раскрытия конфиденциальной информации увеличивается в связи с большим объемом данных, предоставляющимися статистическими организациям и общественности. Наиболее распространенными методами для решения данной проблемы являются методы генерации синтетических данных. К сожалению эти методы имеют эвристический характер, потому что они не имеют четкой теоретической основы. В этой работе представлена формальную модель генерации синтетических данных, обеспечивающих сохранение парных корреляций.
oai:noad.sci.am:135935
Mar 4, 2021
Jul 27, 2020
23
https://noad.sci.am/publication/149528
Հրատարակության անուն | Ամսաթիվ |
---|---|
Vardan Topchyan, Pair Correlations Preserving Model in Synthetic DataGeneration | Mar 4, 2021 |