가명 데이터 수집

GitLab의 데이터베이스는 민감한 정보를 호스팅하므로 분석을 위해 필터링되지 않은 정보를 사용한다는 것은 높은 보안 요구 사항을 의미한다. 이러한 제약을 완화하기 위해 Pseudonymizer 서비스는 가명화된 방식으로 GitLab의 데이터를 내보내는 데 사용된다.

 

1. Pseudonymizer data config

이 설정을 활성화 시키면 GitLab은 구성된 개체 저장소 디렉터리에 업로드될 GitLab 데이터베이스의 가명 CSV를 생성하는 백그라운드 작업을 실행한다.

  • 추가적으로 gitlab.yml에다음 줄을 편집하여 수정한다.

pseudonymizer: manifest: config/pseudonymizer.yml upload: remote_directory: 'gitlab-elt' # bucket name connection: provider: AWS aws_access_key_id: AWS_ACCESS_KEY_ID aws_secret_access_key: AWS_SECRET_ACCESS_KEY region: eu-central-1