Title:
Enhanced Cart Technologies in Partial Synthetic Data Generation ; Улучшенные cart технологии генерации частично синтетическихданных
Author:
Aslanyan Levon ; Левон Асланян
Type:
Co-author(s) :
Topchyan Vardan ; Вардан Топчян
Uncontrolled Keywords:
classification ; regression ; data disclosure ; synthetic data ; классификация ; регрессия ; раскрытие данных ; синтетические данныe
Abstract:
This work aims at studying personal data analysis area, when confidentiality property of data is ensured. It is supposed that we are given partially critical social science data and prior to the submission of data to the public it is required to modify them so that confidential information is not disclosed, and that the analysis of these data did not differ from the analysis of raw data. Our work builds improved algorithms of class of classification and regression trees, which provide solution to the problem of generation of the so-called synthetic data. The new solution of generation takes into account the structure of the areas of privacy and is providing optimized tree replacement for synthetic data sets.
;
Работа посвящена исследованию вопросов анализа персональных данных обеспечивающих конфиденциальность данных. Предполагается что даны частично критические социологические данные и перед представлением этих данных общественности требуется их модифицировать так, чтобы конфиденциальные данные не раскрывались, и чтобы анализ этих данных не отличался от анализа исходных данных. Работа строит улучшенные алгоритмы класс деревьев классификации и регрессии, которые предоставляют решение задачи генерации так называемых синтетических данных. Новое решение учитывает структуры областей конфиденциальности и проводит оптимизацию дерева замены данных на синтетические.
Date of publication:
ISSN:
Language:
Journal or Publication Title:
Information Content and Processing
Volume:
Number:
URL:
Additional Information:
lasl@sci.am ; vardan.topchyan@gmail.com
Affiliation:
Institute for Informatics and Automation Problems