நெட்வொர்க் பாக்கெட் புரோக்கரில் டேட்டா மாஸ்க்கிங் தொழில்நுட்பம் மற்றும் தீர்வு என்ன?

1. தரவு மறைத்தல் கருத்து

தரவு மறைத்தல் தரவு மறைத்தல் என்றும் அழைக்கப்படுகிறது. மறைத்தல் விதிகள் மற்றும் கொள்கைகளை நாங்கள் வழங்கியிருக்கும் போது, ​​மொபைல் ஃபோன் எண், வங்கி அட்டை எண் மற்றும் பிற தகவல்கள் போன்ற முக்கியமான தரவை மாற்றுவது, மாற்றுவது அல்லது மறைப்பது ஒரு தொழில்நுட்ப முறையாகும். இந்த நுட்பம் முதன்மையாக நம்பகத்தன்மையற்ற சூழல்களில் உணர்திறன் தரவை நேரடியாகப் பயன்படுத்துவதைத் தடுக்கப் பயன்படுகிறது.

தரவு மறைத்தல் கொள்கை: தரவு மறைத்தல் அசல் தரவு பண்புகள், வணிக விதிகள் மற்றும் தரவு பொருத்தத்தை பராமரிக்க வேண்டும், இது அடுத்தடுத்த மேம்பாடு, சோதனை மற்றும் தரவு பகுப்பாய்வு ஆகியவை மறைப்பதால் பாதிக்கப்படாது. மறைப்பதற்கு முன்னும் பின்னும் தரவு நிலைத்தன்மை மற்றும் செல்லுபடியை உறுதி செய்யவும்.

2. தரவு மறைத்தல் வகைப்பாடு

தரவு முகமூடியை நிலையான தரவு மறைத்தல் (SDM) மற்றும் டைனமிக் தரவு மறைத்தல் (DDM) எனப் பிரிக்கலாம்.

நிலையான தரவு மறைத்தல் (SDM): நிலையான தரவு மறைப்பதற்கு, உற்பத்தி சூழலில் இருந்து தனிமைப்படுத்துவதற்கு புதிய உற்பத்தி அல்லாத சூழல் தரவுத்தளத்தை நிறுவுதல் தேவைப்படுகிறது. உணர்திறன் தரவு உற்பத்தி தரவுத்தளத்திலிருந்து பிரித்தெடுக்கப்பட்டு பின்னர் உற்பத்தி அல்லாத தரவுத்தளத்தில் சேமிக்கப்படுகிறது. இந்த வழியில், டீசென்சிட்டிஸ் செய்யப்பட்ட தரவு உற்பத்தி சூழலில் இருந்து தனிமைப்படுத்தப்படுகிறது, இது வணிகத் தேவைகளைப் பூர்த்தி செய்கிறது மற்றும் உற்பத்தித் தரவின் பாதுகாப்பை உறுதி செய்கிறது.

SDM

டைனமிக் டேட்டா மாஸ்கிங் (டிடிஎம்): இது பொதுவாக உற்பத்தி சூழலில் உணர்திறன் தரவை உண்மையான நேரத்தில் உணர்திறன் குறைக்கப் பயன்படுகிறது. சில நேரங்களில், வெவ்வேறு சூழ்நிலைகளில் ஒரே முக்கியத் தரவைப் படிக்க வெவ்வேறு நிலைகளில் மறைத்தல் தேவைப்படுகிறது. எடுத்துக்காட்டாக, வெவ்வேறு பாத்திரங்கள் மற்றும் அனுமதிகள் வெவ்வேறு மறைத்தல் திட்டங்களைச் செயல்படுத்தலாம்.

டி.டி.எம்

தரவு அறிக்கை மற்றும் தரவு தயாரிப்புகளை மறைக்கும் பயன்பாடு

இத்தகைய காட்சிகளில் முக்கியமாக உள் தரவு கண்காணிப்பு தயாரிப்புகள் அல்லது விளம்பர பலகை, வெளிப்புற சேவை தரவு தயாரிப்புகள் மற்றும் வணிக அறிக்கைகள் மற்றும் திட்ட மதிப்பாய்வு போன்ற தரவு பகுப்பாய்வு அடிப்படையில் அறிக்கைகள் அடங்கும்.

தரவு அறிக்கை தயாரிப்பு மறைத்தல்

3. தரவு மறைக்கும் தீர்வு

பொதுவான தரவு மறைக்கும் திட்டங்களில் பின்வருவன அடங்கும்: செல்லாததாக்குதல், சீரற்ற மதிப்பு, தரவு மாற்றீடு, சமச்சீர் குறியாக்கம், சராசரி மதிப்பு, ஆஃப்செட் மற்றும் ரவுண்டிங் போன்றவை.

செல்லாததாக்குதல்: செல்லாததாக்குதல் என்பது முக்கியத் தரவின் குறியாக்கம், துண்டித்தல் அல்லது மறைத்தல் ஆகியவற்றைக் குறிக்கிறது. இந்தத் திட்டம் பொதுவாக உண்மையான தரவை சிறப்பு குறியீடுகளுடன் (* போன்றவை) மாற்றுகிறது. செயல்பாடு எளிதானது, ஆனால் பயனர்கள் அசல் தரவின் வடிவமைப்பை அறிய முடியாது, இது அடுத்தடுத்த தரவு பயன்பாடுகளை பாதிக்கலாம்.

சீரற்ற மதிப்பு: சீரற்ற மதிப்பு என்பது முக்கியமான தரவுகளின் சீரற்ற மாற்றத்தைக் குறிக்கிறது (எண்கள் இலக்கங்களை மாற்றுகின்றன, எழுத்துக்கள் எழுத்துக்களை மாற்றுகின்றன, மற்றும் எழுத்துகள் எழுத்துகளை மாற்றுகின்றன). இந்த முகமூடி முறையானது, ஒரு குறிப்பிட்ட அளவிற்கு உணர்திறன் தரவின் வடிவமைப்பை உறுதிசெய்து, அடுத்தடுத்த தரவுப் பயன்பாட்டை எளிதாக்கும். மக்கள் மற்றும் இடங்களின் பெயர்கள் போன்ற சில அர்த்தமுள்ள வார்த்தைகளுக்கு மறைமுக அகராதிகள் தேவைப்படலாம்.

தரவு மாற்றீடு: தரவு மாற்றீடு என்பது பூஜ்ய மற்றும் சீரற்ற மதிப்புகளை மறைப்பதைப் போன்றது, தவிர, சிறப்பு எழுத்துகள் அல்லது சீரற்ற மதிப்புகளைப் பயன்படுத்துவதற்குப் பதிலாக, மறைக்கும் தரவு ஒரு குறிப்பிட்ட மதிப்புடன் மாற்றப்படுகிறது.

சமச்சீர் குறியாக்கம்: சமச்சீர் குறியாக்கம் என்பது ஒரு சிறப்பு மீளக்கூடிய மறைத்தல் முறையாகும். இது குறியாக்க விசைகள் மற்றும் அல்காரிதம்கள் மூலம் முக்கியமான தரவை குறியாக்குகிறது. சைபர்டெக்ஸ்ட் வடிவம் தருக்க விதிகளில் உள்ள அசல் தரவுகளுடன் ஒத்துப்போகிறது.

சராசரி: சராசரி திட்டம் பெரும்பாலும் புள்ளியியல் காட்சிகளில் பயன்படுத்தப்படுகிறது. எண் தரவுகளுக்கு, நாம் முதலில் அவற்றின் சராசரியைக் கணக்கிடுகிறோம், பின்னர் சராசரியைச் சுற்றி டீசென்சிடைஸ் செய்யப்பட்ட மதிப்புகளை தோராயமாக விநியோகிக்கிறோம், இதனால் தரவின் கூட்டுத்தொகை மாறாமல் இருக்கும்.

ஆஃப்செட் மற்றும் ரவுண்டிங்: இந்த முறை ரேண்டம் ஷிப்ட் மூலம் டிஜிட்டல் தரவை மாற்றுகிறது. ஆஃப்செட் ரவுண்டிங் ஆனது, தரவின் பாதுகாப்பைப் பராமரிக்கும் போது வரம்பின் தோராயமான நம்பகத்தன்மையை உறுதி செய்கிறது, இது முந்தைய திட்டங்களை விட உண்மையான தரவுகளுடன் நெருக்கமாக உள்ளது மற்றும் பெரிய தரவு பகுப்பாய்வு சூழ்நிலையில் பெரும் முக்கியத்துவத்தைக் கொண்டுள்ளது.

ML-NPB-5660-数据脱敏

பரிந்துரைக்கப்பட்ட மாதிரி"ML-NPB-5660"தரவு மறைப்பதற்கு

4. பொதுவாக பயன்படுத்தப்படும் தரவு மறைக்கும் நுட்பங்கள்

(1) புள்ளியியல் நுட்பங்கள்

தரவு மாதிரி மற்றும் தரவு திரட்டுதல்

- தரவு மாதிரியாக்கம்: தரவுத் தொகுப்பின் பிரதிநிதி துணைக்குழுவைத் தேர்ந்தெடுப்பதன் மூலம் அசல் தரவுத் தொகுப்பின் பகுப்பாய்வு மற்றும் மதிப்பீடு, அடையாள நீக்குதல் நுட்பங்களின் செயல்திறனை மேம்படுத்துவதற்கான ஒரு முக்கியமான முறையாகும்.

- தரவுத் திரட்டல்: மைக்ரோடேட்டாவில் உள்ள பண்புக்கூறுகளுக்குப் பயன்படுத்தப்படும் புள்ளியியல் நுட்பங்களின் (தொகுப்பு, எண்ணுதல், சராசரி, அதிகபட்சம் மற்றும் குறைந்தபட்சம் போன்றவை) தொகுப்பாக, இதன் விளைவாக அசல் தரவுத் தொகுப்பில் உள்ள அனைத்துப் பதிவுகளையும் பிரதிநிதித்துவப்படுத்துகிறது.

(2) குறியாக்கவியல்

கிரிப்டோகிராஃபி என்பது உணர்திறன் குறைவதற்கான ஒரு பொதுவான முறையாகும். வெவ்வேறு வகையான குறியாக்க அல்காரிதம்கள் வெவ்வேறு டிசென்சிடைசேஷன் விளைவுகளை அடையலாம்.

- தீர்மானிக்கும் குறியாக்கம்: ஒரு சீரற்ற சமச்சீர் குறியாக்கம். இது வழக்கமாக ஐடி தரவை செயலாக்குகிறது மற்றும் தேவையான போது மறைக்குறியீட்டை அசல் ஐடிக்கு டிக்ரிப்ட் செய்து மீட்டெடுக்கலாம், ஆனால் விசை சரியாகப் பாதுகாக்கப்பட வேண்டும்.

- மீளமுடியாத குறியாக்கம்: ஹாஷ் செயல்பாடு தரவைச் செயலாக்கப் பயன்படுகிறது, இது பொதுவாக ஐடி தரவுகளுக்குப் பயன்படுத்தப்படுகிறது. இதை நேரடியாக டிக்ரிப்ட் செய்ய முடியாது மற்றும் மேப்பிங் உறவைச் சேமிக்க வேண்டும். கூடுதலாக, ஹாஷ் செயல்பாட்டின் அம்சம் காரணமாக, தரவு மோதல் ஏற்படலாம்.

- ஹோமோமார்பிக் என்க்ரிப்ஷன்: சைபர்டெக்ஸ்ட் ஹோமோமார்பிக் அல்காரிதம் பயன்படுத்தப்படுகிறது. அதன் சிறப்பியல்பு என்னவென்றால், மறைக்குறியீடு செயல்பாட்டின் விளைவு மறைகுறியாக்கத்திற்குப் பிறகு எளிய உரைச் செயல்பாட்டின் விளைவு ஆகும். எனவே, இது பொதுவாக எண் புலங்களைச் செயலாக்கப் பயன்படுகிறது, ஆனால் செயல்திறன் காரணங்களுக்காக இது பரவலாகப் பயன்படுத்தப்படுவதில்லை.

(3) கணினி தொழில்நுட்பம்

தனியுரிமைப் பாதுகாப்பைப் பூர்த்தி செய்யாத, ஆனால் அவற்றை வெளியிடாத தரவு உருப்படிகளை அடக்குதல் தொழில்நுட்பம் நீக்குகிறது அல்லது பாதுகாக்கிறது.

- மறைத்தல்: எதிராளியின் எண், அடையாள அட்டை நட்சத்திரக் குறியீடு அல்லது முகவரி துண்டிக்கப்பட்டது போன்ற பண்புக்கூறு மதிப்பை மறைப்பதற்கான மிகவும் பொதுவான டீசென்சிடைசேஷன் முறையைக் குறிக்கிறது.

- உள்ளூர் அடக்குமுறை: குறிப்பிட்ட பண்புக்கூறு மதிப்புகளை (நெடுவரிசைகள்) நீக்குதல், அத்தியாவசியமற்ற தரவு புலங்களை அகற்றுதல்;

- பதிவு அடக்குதல்: குறிப்பிட்ட பதிவுகளை (வரிசைகள்) நீக்குதல், அத்தியாவசியமற்ற தரவுப் பதிவுகளை நீக்குதல் ஆகியவற்றைக் குறிக்கிறது.

(4) புனைப்பெயர் தொழில்நுட்பம்

சூடோமேனிங் என்பது ஒரு நேரடி அடையாளங்காட்டியை (அல்லது பிற உணர்திறன் அடையாளங்காட்டி) மாற்றுவதற்கு ஒரு புனைப்பெயரை பயன்படுத்தும் ஒரு அடையாள நீக்குதல் நுட்பமாகும். புனைப்பெயர் நுட்பங்கள் நேரடி அல்லது உணர்திறன் அடையாளங்காட்டிகளுக்குப் பதிலாக ஒவ்வொரு தனிப்பட்ட தகவல் விஷயத்திற்கும் தனிப்பட்ட அடையாளங்காட்டிகளை உருவாக்குகின்றன.

- இது அசல் ஐடியுடன் தொடர்புடைய சீரற்ற மதிப்புகளை உருவாக்கலாம், மேப்பிங் டேபிளைச் சேமிக்கலாம் மற்றும் மேப்பிங் டேபிளுக்கான அணுகலை கண்டிப்பாகக் கட்டுப்படுத்தலாம்.

- நீங்கள் புனைப்பெயர்களை உருவாக்க குறியாக்கத்தையும் பயன்படுத்தலாம், ஆனால் மறைகுறியாக்க விசையை சரியாக வைத்திருக்க வேண்டும்;

திறந்த இயங்குதள சூழ்நிலையில் OpenID போன்ற அதிக எண்ணிக்கையிலான சுயாதீன தரவு பயனர்களின் விஷயத்தில் இந்த தொழில்நுட்பம் பரவலாகப் பயன்படுத்தப்படுகிறது, வெவ்வேறு டெவலப்பர்கள் ஒரே பயனருக்கு வெவ்வேறு Openidகளைப் பெறுகின்றனர்.

(5) பொதுமைப்படுத்தல் நுட்பங்கள்

பொதுமைப்படுத்தல் நுட்பம் என்பது ஒரு தரவுத் தொகுப்பில் தேர்ந்தெடுக்கப்பட்ட பண்புக்கூறுகளின் கிரானுலாரிட்டியைக் குறைக்கும் மற்றும் தரவின் மிகவும் பொதுவான மற்றும் சுருக்கமான விளக்கத்தை வழங்கும் அடையாள நீக்க நுட்பத்தைக் குறிக்கிறது. பொதுமைப்படுத்தல் தொழில்நுட்பம் செயல்படுத்த எளிதானது மற்றும் பதிவு-நிலை தரவுகளின் நம்பகத்தன்மையைப் பாதுகாக்க முடியும். இது பொதுவாக தரவு தயாரிப்புகள் அல்லது தரவு அறிக்கைகளில் பயன்படுத்தப்படுகிறது.

- ரவுண்டிங்: 100, 500, 1K மற்றும் 10K போன்ற முடிவுகளைத் தரும் மேல்நோக்கி அல்லது கீழ்நோக்கி தடயவியல் போன்ற தேர்ந்தெடுக்கப்பட்ட பண்புக்கூறுக்கான ரவுண்டிங் பேஸைத் தேர்ந்தெடுப்பதை உள்ளடக்கியது.

- மேல் மற்றும் கீழ் குறியீட்டு நுட்பங்கள்: வாசலுக்கு மேலே உள்ள (அல்லது கீழே) மதிப்புகளை மேல் (அல்லது கீழ்) அளவைக் குறிக்கும் வாசலில் மாற்றவும், இது "Xக்கு மேல்" அல்லது "Xக்குக் கீழே" என்ற முடிவை அளிக்கிறது.

(6) சீரற்றமயமாக்கல் நுட்பங்கள்

ஒரு வகையான அடையாள நீக்க நுட்பமாக, சீரற்றமயமாக்கல் தொழில்நுட்பம் என்பது ஒரு பண்புக்கூறின் மதிப்பை ரேண்டமைசேஷன் மூலம் மாற்றியமைப்பதைக் குறிக்கிறது, இதனால் சீரற்றமயமாக்கலுக்குப் பிறகு மதிப்பு அசல் உண்மையான மதிப்பிலிருந்து வேறுபட்டது. இந்த செயல்முறையானது, அதே தரவுப் பதிவில் உள்ள மற்ற பண்புக்கூறு மதிப்புகளிலிருந்து ஒரு பண்புக்கூறு மதிப்பைப் பெறுவதற்கான தாக்குதலாளியின் திறனைக் குறைக்கிறது, ஆனால் உற்பத்திச் சோதனைத் தரவுகளுடன் பொதுவான தரவின் நம்பகத்தன்மையைப் பாதிக்கிறது.


இடுகை நேரம்: செப்-27-2022