가명 데이터 수집
GitLab의 데이터베이스는 민감한 정보를 호스팅하므로 분석을 위해 필터링되지 않은 정보를 사용한다는 것은 높은 보안 요구 사항을 의미한다. 이러한 제약을 완화하기 위해 Pseudonymizer 서비스는 가명화된 방식으로 GitLab의 데이터를 내보내는 데 사용된다.
1. Pseudonymizer data config
이 설정을 활성화 시키면 GitLab은 구성된 개체 저장소 디렉터리에 업로드될 GitLab 데이터베이스의 가명 CSV를 생성하는 백그라운드 작업을 실행한다.
추가적으로
gitlab.yml
에다음 줄을 편집하여 수정한다.
pseudonymizer:
manifest: config/pseudonymizer.yml
upload:
remote_directory: 'gitlab-elt' # bucket name
connection:
provider: AWS
aws_access_key_id: AWS_ACCESS_KEY_ID
aws_secret_access_key: AWS_SECRET_ACCESS_KEY
region: eu-central-1