중요합니다
영어가 아닌 번역은 편의를 위해서만 제공됩니다. 바인딩 버전을 위해 이 문서의 EN-US
버전을 참조하세요.
투명성 고지란?
중요합니다
이 문서에서는 Azure AI Language에 대한 지침 및 모범 사례를 잘 알고 있다고 가정합니다. 자세한 내용은 Azure AI 언어에 대한 투명도 참고를 참조하세요.
AI 시스템에는 기술뿐만 아니라 기술을 사용하는 사람, 영향을 받는 사람, 배포되는 환경이 포함됩니다. 의도한 목적에 맞는 시스템을 만들려면 기술의 작동 방식, 기능 및 제한 사항, 최상의 성능을 달성하는 방법에 대한 이해가 필요합니다. Microsoft의 투명성 고지는 Microsoft의 AI 기술의 작동 방식, 시스템 소유자가 시스템 성능과 동작에 영향을 줄 수 있는 선택 사항 그리고 기술, 사람, 환경을 포함한 전체 시스템에 대한 사고의 중요성을 이해하는 데 도움을 주기 위한 것입니다. 투명성 고지는 자체 시스템을 개발 또는 배포할 때 사용하거나 시스템을 사용하거나 시스템의 영향을 받을 사람들과 공유할 수 있습니다.
Microsoft의 투명성 노트는 Ai 원칙을 실천하기 위한 Microsoft의 광범위한 노력의 일환입니다. 자세한 내용은 Microsoft의 책임 있는 AI 원칙을 참조하세요.
주요 구문 추출 소개
Azure AI 언어 핵심 구 추출 기능을 사용하면 텍스트의 주요 개념을 빠르게 식별할 수 있습니다. 예를 들어 "음식이 맛있었고 훌륭한 직원이 있었다"라는 텍스트에서 핵심 구 추출은 "음식"과 "훌륭한 직원"이라는 주요 대화 포인트를 반환합니다. 필수적이지 않은 단어는 취소되고, 문장의 주어나 목적어로 보이는 단일 용어나 구가 반환됩니다.
다른 Azure AI 언어 기능과 달리 이 기능에 대한 신뢰도 점수는 반환되지 않습니다.
사용 사례 예
핵심 구 추출은 다양한 산업의 여러 시나리오에서 사용됩니다. 몇 가지 예는 다음과 같습니다.
- 검색 향상. 핵심 구를 사용하여 검색 결과를 향상시킬 수 있는 검색 인덱스를 만들 수 있습니다. 예를 들어 고객은 수천 건의 문서를 제공한 다음 기본 제공 Azure Search 기술을 사용하여 핵심 구 추출을 실행할 수 있습니다. 이 결과는 입력 데이터 세트의 핵심 구로, 인덱스를 만드는 데 사용할 수 있습니다. 이 인덱스는 사용할 수 있는 새 문서 집합이 있을 때마다 기술을 다시 실행하여 업데이트할 수 있습니다.
- 텍스트 데이터의 집계 추세를 봅니다. 예를 들어 텍스트 메모 또는 피드백의 주요 개념을 시각화하는 데 도움이 되는 핵심 구를 사용하여 단어 클라우드를 생성할 수 있습니다. 예를 들어, 호텔은 댓글에서 식별된 핵심 문구를 기반으로 단어 클라우드를 생성할 수 있으며, 사람들이 위치, 청결 및 유용한 직원에 대해 가장 자주 댓글을 달고 있는 것을 볼 수 있습니다.
사용 사례 선택 시 고려 사항
사용하지 마세요.
- 위험 수준이 높은 시나리오에 대한 사람의 개입 없이 자동 작업에는 사용하지 마세요. 사람은 다른 사람의 경제 상황, 건강 또는 안전에 영향을 받을 때 항상 원본 데이터를 검토해야 합니다.
법률 및 규제 고려 사항: 조직은 모든 업계 또는 시나리오에서 사용하기에 적합하지 않을 수 있는 AI 서비스 및 솔루션을 사용할 때 잠재적인 특정 법률 및 규제 의무를 평가해야 합니다. 또한 AI 서비스나 솔루션은 해당 서비스 약관 및 관련 행동 강령에서 금지하는 방식으로 설계되지 않았으며, 그러한 방식으로 사용될 수 없습니다.
특성 및 제한 사항
시나리오 및 입력 데이터에 따라 다양한 수준의 성능을 경험할 수 있습니다. 다음 정보는 Azure AI 언어 핵심 구 추출 기능을 사용할 때 적용되는 성능에 대한 주요 개념을 이해하는 데 도움이 되도록 설계되었습니다.
성능 향상을 위한 시스템 제한 사항 및 모범 사례
다른 Azure AI 언어 기능 모델과 달리, 핵심 구 추출 모델은 사람이 레이블을 지정한 기준 데이터를 기반으로 학습되지 않은 감독되지 않는 모델입니다. 서비스에 전송된 텍스트의 모든 명사 구가 검색된 다음 빈도 및 동시 발생에 따라 순위가 매겨집니다. 따라서 모델에서 반환되는 내용이 인간이 가장 중요한 구로 선택하는 것에 동의하지 않을 수 있습니다. 경우에 따라 모델을 수정하는 형용사 없이 명사가 반환된다는 측면에서 모델이 부분적으로 올바른 것처럼 보일 수 있습니다.
- 텍스트가 길면 성능이 향상됩니다. 원본 텍스트를 문장이나 단락과 같은 조각으로 나누지 마세요. 전체 텍스트(예: 전체 고객 검토 또는 문서 추상)를 보냅니다.
- 텍스트에 분석하려는 실제 콘텐츠와 국소 관련성이 없는 상용구 또는 기타 텍스트가 포함된 경우 이 텍스트의 단어는 결과에 영향을 줍니다. 예를 들어 전자 메일에는 텍스트에 포함된 "제목:", "본문:", "보낸 사람:" 등이 있을 수 있습니다. 서비스에 보내기 전에 분석하려는 실제 콘텐츠의 일부가 아닌 알려진 텍스트를 제거하는 것이 좋습니다.