중요합니다
이 문서에서는 Azure Machine Learning SDK v1 사용에 대한 정보를 제공합니다. SDK v1은 2025년 3월 31일부터 더 이상 사용되지 않습니다. 지원은 2026년 6월 30일에 종료됩니다. 해당 날짜까지 SDK v1을 설치하고 사용할 수 있습니다.
2026년 6월 30일 이전에 SDK v2로 전환하는 것이 좋습니다. SDK v2에 대한 자세한 내용은 Azure Machine Learning CLI 및 Python SDK v2란? 및 SDK v2 참조를 참조하세요.
이 문서에서는 Python 스크립트 실행 구성 요소를 사용하여 Azure Machine Learning 디자이너에 사용자 지정 논리를 추가하는 방법을 설명합니다. 이 가이드에서는 Pandas 라이브러리를 사용하여 간단한 기능 엔지니어링을 수행합니다.
기본 제공 코드 편집기를 사용하여 간단한 Python 논리를 빠르게 추가할 수 있습니다. zip 파일 메서드를 사용하여 더 복잡한 코드를 추가하거나 더 많은 Python 라이브러리를 업로드해야 합니다.
기본 실행 환경에서는 Python의 Anacondas 배포를 사용합니다. 미리 설치된 패키지의 전체 목록은 Python 스크립트 실행 구성 요소 참조를 참조하세요.
중요합니다
스튜디오 또는 디자이너의 단추와 같이 이 문서에 언급된 그래픽 요소가 보이지 않는 경우 작업 영역에 대한 적절한 사용 권한이 없는 것일 수 있습니다. Azure 구독 관리자에게 문의하여 적절한 액세스 권한이 부여되었는지 확인하세요. 자세한 내용은 사용자 및 역할 관리를 참조하세요.
디자이너에서 Python 코드 실행
Python 스크립트 실행 구성 요소 추가
Azure Machine Learning 스튜디오에 로그인하고 사용하려는 작업 영역을 선택합니다.
사이드바 메뉴에서 디자이너 를 선택합니다. 클래식 미리 빌드된 상태에서 미리 빌드된 클래식 구성 요소를 사용하여 새 파이프라인 만들기를 선택합니다.
파이프라인 캔버스의 왼쪽에서 구성 요소를 선택합니다.
Python 언어 섹션에서 Python 스크립트 실행 구성 요소를 찾습니다. 구성 요소를 파이프라인 캔버스로 끌어다 놓습니다.
입력 데이터 세트 연결
샘플 데이터 섹션에서 자동차 가격 데이터(원시) 샘플 데이터 세트를 찾습니다. 데이터 세트를 파이프라인 캔버스로 끌어서 놓습니다.
데이터 세트 출력 포트를 Python 스크립트 실행 구성 요소 왼쪽 상단에 있는 입력 포트에 연결합니다. 디자이너는 입력을 진입점 스크립트에 매개 변수로 표시합니다.
오른쪽 입력 포트는 압축된 Python 라이브러리용으로 예약되어 있습니다.
사용하는 특정 입력 포트를 주의 깊게 확인합니다. 디자이너는
dataset1
변수에 왼쪽 입력 포트를 할당하고dataset2
에 가운데 입력 포트를 할당합니다.
Python 스크립트 실행 구성 요소에서 직접 데이터를 생성하거나 가져올 수 있으므로 입력 구성 요소는 선택 사항입니다.
Python 코드 작성
디자이너는 고유 Python 코드를 편집하고 입력할 수 있는 초기 진입점 스크립트를 제공합니다.
이 예제에서는 Pandas를 사용하여 두 개의 자동차 데이터 세트 열인 Price 와 Horsepower를 결합하여 마력당 달러라는 새 열을 만듭니다. 이 열은 각 마력 단위에 대한 비용을 나타내며 이는 특정 자동차가 해당 금액에 적합한지 결정하는 데 유용한 정보 포인트가 될 수 있습니다.
Python 스크립트 실행 구성 요소를 두 번 클릭합니다.
캔버스 오른쪽에 표시되는 창에서 Python 스크립트 텍스트 상자를 선택합니다.
다음 코드를 복사하여 텍스트 상자에 붙여 넣습니다.
import pandas as pd def azureml_main(dataframe1 = None, dataframe2 = None): dataframe1['Dollar/HP'] = dataframe1.price / dataframe1.horsepower return dataframe1
파이프라인은 이 이미지와 같습니다.
진입점 스크립트는
azureml_main
함수를 포함해야 합니다. 함수에는 Python 스크립트 실행 구성 요소의 두 입력 포트에 매핑되는 두 개의 함수 매개 변수가 있습니다.반환 값은 Pandas 데이터 프레임이어야 합니다. 최대 2개의 데이터 프레임을 구성 요소 출력으로 반환할 수 있습니다.
파이프라인을 제출합니다.
이제 새 달러/HP 기능이 있는 데이터 세트가 있습니다. 이 새로운 기능은 자동차 추천자를 학습시키는 데 도움이 될 수 있습니다. 이 예제는 기능 추출 및 차원 감소를 보여 줍니다.