추출 요약 설명

완료됨

추출 요약 은 원본 텍스트에서 직접 필수 문장을 추출하여 요약을 생성합니다. 새 텍스트를 생성하는 대신 자연어 처리 기술을 사용하여 문서의 기본 아이디어 또는 컨텍스트를 전체적으로 전달하는 문장을 찾습니다.

추출 요약은 summarize_extractive() 확장의 azure_cognitive 스키마에 있는 azure_ai 함수를 사용하여 수행됩니다. azure_cognitive 스키마에는 summarize_extractive() 함수의 세 오버로드가 포함됩니다. 세 가지 함수 오버로드가 예상하는 인수 목록은 다음과 같습니다.

논쟁 유형 기본값 설명
문자 메시지 text 또는 text[] 요약을 생성해야 하는 텍스트입니다.
language_text text 또는 text[] 요약할 텍스트의 언어를 나타내는 언어 코드(또는 언어 코드 배열)입니다. 지원되는 언어 목록을 검토하여 필요한 언어 코드를 검색합니다.
sentence_count integer 3 생성할 요약 문장의 수입니다.
sort_by text 'offset' 생성된 요약 문장의 정렬 순서입니다. 허용되는 값은 "오프셋"과 "순위"입니다. 오프셋은 원본 콘텐츠 내에서 추출된 각 문장의 시작 위치를 나타내며 순위는 문장이 콘텐츠의 주요 아이디어와 얼마나 관련성이 있는지에 대한 AI 생성 표시기입니다.
batch_size integer 이십오 (25) text[] 입력이 예상되는 두 가지 오버로드에만 해당됩니다. 한 번에 처리할 레코드 수를 지정합니다.
서비스 로그 비활성화 boolean 거짓 서비스 로그를 비활성화 여부를 나타내는 플래그입니다.
타임아웃_밀리초 (timeout_ms) integer 없음 작업이 중지된 후의 시간 제한(밀리초)입니다.
throw_on_error boolean 맞다 함수가 오류 발생 시 예외를 throw하여 래핑 트랜잭션을 롤백해야 하는지 여부를 나타내는 플래그입니다.
최대_시도_횟수 integer 1 오류가 발생한 경우 Azure AI 서비스에 대한 호출을 다시 시도하는 횟수입니다.
retry_delay_ms (재시도 지연 시간 밀리초) integer 1000 Azure AI 서비스 엔드포인트 호출을 다시 시도하기 전에 대기하는 시간(밀리초)입니다.

각 함수는 아래 표와 같이 azure_cognitive.sentence 복합 형식을 사용하여 추출된 문장 배열과 각 문장에 대한 순위 점수를 반환합니다.

            Composite type "azure_cognitive.sentence"
    Column  |       Type       | Collation | Nullable | Default | Storage  | Description 
------------+------------------+-----------+----------+---------+----------+-------------
 text       | text             |           |          |         | extended | 
 rank_score | double precision |           |          |         | plain    |

azure_cognitive.sentence 추출 문장의 텍스트와 각 문장의 순위 점수를 포함하는 복합 형식입니다. 0에서 1(포함) 사이의 값인 순위 점수는 문장이 원본 문서의 주요 아이디어와 얼마나 관련성이 있는지를 나타냅니다. 문서 요약은 추출된 문장의 순위를 지정하며, 함수의 sort_by 매개 변수를 사용하여 표시되는 순서대로 반환되는지 또는 순위에 따라 반환되는지 확인할 수 있습니다.

속성 설명에 대한 추출 요약 생성

Margie's Travel 개발자는 azure_ai 확장 및 Azure AI Services를 통해 액세스할 수 있는 추출 요약 기술을 평가하고 데이터베이스의 첫 번째 목록에서 설명과 같은 긴 속성 설명의 간결하고 자연어 요약을 생성하는 방법의 기능을 평가하려고 합니다.

"중앙 퀸 앤 힐의 서쪽에 위치한이 매력적인 1 베드룸 아파트에서 집에서 자신을 확인합니다. 우아하게 꾸며진 이 전용 아파트(이중 하단 단위)에는 개방형 평면도, 대나무 바닥, 완비된 주방, TV, DVD 플레이어, 기본 케이블, 퀸사이즈 침대가 구비된 아늑한 침실이 있습니다. 이 객실은 최대 4명(침실 2개, 편안한 접이식 소파에 2개, 린넨 포함)을 갖추고 있으며, 무료 Wi-Fi 및 세탁실을 갖추고 있습니다. 아파트는 전용 데크로 연결되어 있으며, 정원과 검은 대나무 숲이 내려다보이는 바비큐 시설이 완비되어 있습니다. 아파트는 버스 노선에서 불과 한 블록 떨어진 곳에 완벽하게 위치해 있으며, 15분 안에 시애틀 시내를 오가거나 10분 안에 역사적인 밸라드(Ballard)가 될 수 있습니다. 도보로 5분이면 자연 식료품점과 커피숍이 있습니다. 또는 퀸 앤 힐(Queen Anne Hill) 꼭대기까지 도보로 15분 거리에 다양한 상점, 바, 레스토랑이 있습니다."

다음 쿼리를 사용하여 위의 속성 설명에 대한 두 문장 요약을 요청합니다.

SELECT
  azure_cognitive.summarize_extractive(description, 'en', 2) AS extractive_summary
FROM listings
WHERE id = 1;

추출 요약은 원래 텍스트에서 점수가 가장 높은 두 문장과 각각에 대한 순위 점수를 반환합니다.

{
  "("Make your self at home in this charming one-bedroom apartment, centrally-located on the west side of Queen Anne hill.",1)",
  "("This elegantly-decorated, completely private apartment (bottom unit of a duplex) has an open floor plan, bamboo floors, a fully equipped kitchen, a TV, DVD player, basic cable, and a very cozy bedroom with a queen-size bed.",0.49)"
}