Amazon MWAA는 Amazon S3 bucket을 사용하여 Airflow DAG 및 Plugin 파일을 저장합니다. Amazon S3에 Airflow 환경을 위한 bucket을 생성해야 합니다. S3 bucket 이름은 글로벌적으로 고유해야 하며 MWAA 환경과 동일한 AWS 리전에 생성해야 합니다.
mwaa-sagemaker-bucket-<your_aws_account_id>로 설정 하십시오.<your_aws_account_id> 문구는 현재 사용하고 있는 12자리 AWS Account ID로 변경하십시오.
Bucket 리전은 MWAA 환경과 동일한 리전을 사용하십시오.
다른 모든 설정은 그대로 유지하고 bucket을 생성 하십시오.
새로 생성 된 S3 bucket의 이름을 기록해 두십시오.
ML workflow를 실행하기 위해 필요한 Python package를 Airflow 환경에 설치해야 합니다. 다음 명령어를 Cloud9 workspace의 terminal에서 실행하여 requirements.txt 파일을 만들고 Airflow S3 bucket으로 업로드 하십시오.
CLI를 실행하기 전에 <your_aws_account_id> 문구는 현재 사용하고 있는 12자리 AWS Account ID로 변경해야 합니다.
cd ~/environment
touch requirements.txt
echo "apache-airflow-providers-amazon==1.3.0" > requirements.txt
echo "fsspec" >> requirements.txt
echo "s3fs" >> requirements.txt
echo "pandas" >> requirements.txt
echo "sagemaker==v1.72" >> requirements.txt
aws s3 cp ./requirements.txt s3://mwaa-workshop-<your_aws_account_id>/


core.enable_xcom_pickling)을 추가 하십시오.
Airflow 환경이 변경 되기까지 약 5~10분 정도의 시간이 소요 됩니다. 환경 상태가 Available이 될 때까지 기다릴 필요 없이 다음 IAM 역할 설정을 진행 하십시오.

프로덕션 환경에서 IAM 정책을 생성 할 때 최소 권한을 부여하거나 작업을 수행하는 데 필요한 권한 만 부여하는 표준 보안 권고를 따르십시오.

AirflowSageMakerExecutionRole 이름으로 역할을 생성 하십시오.

AmazonS3FullAccess 정책을 추가해 주십시오.ML 파이프라인 모듈을 성공적으로 실행 하려면 AirflowSagemakerExecutionRole은 AmazonSagemkerFullAccess와 AmazonS3FullAccess 정책을 가지고 있어야 합니다.
