이 콘텐츠는checkmarkv4.0(GA)이전 버전:blue-checkmark v3.1(GA) :::moniker-end에 적용됩니다.
이 콘텐츠는
확인 표시최신 버전: | purple-checkmarkv4.0(GA)에 적용됩니다.
문서 인텔리전스 세금 모델은 강력한 OCR(광학 인식) 기능을 사용하여 선택한 세금 문서 그룹에서 키 필드와 품목을 분석하고 추출합니다. 세금 문서는 1099, 1098, W2, 1040, 1095A, 1095C, W-4, 1099-SSA와 같은 다양한 형식일 수 있습니다. 입력 형식에는 휴대폰 캡처 이미지, 스캔한 문서 및 디지털 PDF가 포함될 수 있습니다. API는 문서 텍스트를 분석합니다. 키 정보를 추출하고 구조화된 JSON 데이터 표현을 반환합니다. 이 모델은 현재 특정 영어 세금 문서 형식을 지원합니다.
지원되는 세금 양식 유형:
- 통합 세금 미국
- W-2
- 1098
- 1098-E
- 1098-T
- 1099 및 변형(1099-SSA 추가)
- 1040 및 변형
- 1095A, 1095C
- W-4
자동화된 세금 문서 처리
자동화된 세금 문서 처리는 세금 문서에서 주요 필드를 추출하는 프로세스입니다. 과거에는 세금 문서가 수동으로 처리되었습니다. 이 모델을 사용하면 세금 시나리오를 쉽게 자동화할 수 있습니다.
통합 세금 미국
Unified US Tax 미리 빌드된 모델은 제출된 문서의 , 및 W2세금 양식에서 10981040데이터를 자동으로 검색하고 1099 추출합니다. 이러한 문서는 여러 세금 또는 비과세 관련 문서로 구성될 수 있습니다. 모델은 지원하는 양식만 처리합니다.
개발 옵션
문서 인텔리전스 v4.0: 2024-11-30 (GA)은 다음 도구, 애플리케이션 및 라이브러리를 지원합니다.
| 기능 | 리소스 | 모델 아이디 |
|---|---|---|
| 미국 세금 양식 모델 | • 문서 인텔리전스 스튜디오 • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
• prebuilt-tax.us • 미리 빌드된-tax.us.w2 • 미리 빌드된-tax.us.W-4 • 미리 빌드된-tax.us.1095A • 미리 빌드된-tax.us.109 5C • 미리 빌드된-tax.us.1098 • 미리 빌드된-tax.us.1098E • 미리 빌드된-tax.us.1098T • 미리 빌드된-tax.us.1099A • 미리 빌드된-tax.us.1099B • 미리 빌드된-tax.us.1099C • 미리 빌드된-tax.us.1099CAP • 미리 빌드된 세금입니다. us.1099Combo • prebuilt-tax.us.1099DIV • prebuilt-tax.us.1099G • prebuilt-tax.us.1099H • prebuilt-tax.us.1099INT• prebuilt-tax.us.1099K • prebuilt-tax.us.1099LS • prebuilt-tax.us.1099LTC • 미리 빌드된 tax.us.1099MISC • 미리 빌드된-tax.us.1099NEC • 미리 빌드된-tax.us.1099OID • 미리 빌드된-tax.us.us.. 1099PATR • 미리 빌드된-tax.us.1099Q • 미리 빌드된-tax.us.1099QA • 미리 빌드된-tax.us.1099R • 미리 빌드된-tax.us.1099S • prebuilt-tax.us.1099SA • prebuilt-tax.us.1099SB • prebuilt-tax.us.1099SSA • prebuilt-tax.us.1040• prebuilt-tax.us.1040Schedule1 • prebuilt-tax.us.1040Schedule2 • prebuilt-tax.us.1040Schedule3 • prebuilt-tax.us.1040Schedule8812 • prebuilt-tax.us.1040ScheduleA • prebuilt-tax.us.1040ScheduleB • prebuilt-tax.us.1040ScheduleC • prebuilt-tax.us.1040ScheduleD • prebuilt-tax.us.1040ScheduleE • prebuilt-tax.us.1040ScheduleEIC • prebuilt-tax.us.1040ScheduleF • prebuilt-tax.us.1040ScheduleH • prebuilt-tax.us.1040ScheduleJ • prebuilt-tax.us.1040ScheduleR • prebuilt-tax.us.1040ScheduleSE • prebuilt-tax.us.1040Senior |
문서 인텔리전스 v3.1은 다음 도구, 애플리케이션, 라이브러리를 지원합니다.
| 기능 | 리소스 | 모델 아이디 |
|---|---|---|
| 미국 세금 양식 모델 | • 문서 인텔리전스 스튜디오 • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
• 미리 빌드된-tax.us.w2 • 미리 빌드된-tax.us.1098 • 미리 빌드된-tax.us.1098E • 미리 빌드된-tax.us.1098T |
문서 인텔리전스 v3.0은 다음 도구, 애플리케이션, 라이브러리를 지원합니다.
| 기능 | 리소스 | 모델 아이디 |
|---|---|---|
| 미국 세금 양식 모델 | • 문서 인텔리전스 스튜디오 • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
• 미리 빌드된-tax.us.w2 • 미리 빌드된-tax.us.1098 • 미리 빌드된-tax.us.1098E • 미리 빌드된-tax.us.1098T |
입력 요구 사항
지원되는 파일 형식은 다음과 같습니다.
| 모델 | 이미지: JPEG/JPG, PNG, BMP, TIFF, HEIF |
Office: Word(DOCX), Excel(XLSX), PowerPoint(PPTX), HTML |
|
|---|---|---|---|
| 읽기 | ✔ | ✔ | ✔ |
| 레이아웃 | ✔ | ✔ | ✔ |
| 일반 문서 | ✔ | ✔ | |
| 사전 제작 | ✔ | ✔ | |
| 사용자 지정 추출 | ✔ | ✔ | |
| 사용자 지정 분류 | ✔ | ✔ | ✔ |
- 사진 및 스캔: 최상의 결과를 위해 문서당 하나의 명확한 사진 또는 고품질 스캔을 제공합니다.
- PDF 및 TIFF: PDF 및 TIFF의 경우 최대 2,000페이지를 처리할 수 있습니다. (무료 계층 구독을 사용하면 처음 두 페이지만 처리됩니다.)
- 파일 크기: 문서를 분석하기 위한 파일 크기는 유료(S0) 계층의 경우 500MB, 무료(F0) 계층의 경우 4MB입니다.
- 이미지 차원: 크기는 50픽셀 x 50픽셀에서 10,000픽셀 x 10,000픽셀 사이여야 합니다.
- 암호 잠금: PDF가 암호로 잠긴 경우 제출하기 전에 잠금을 제거해야 합니다.
- 텍스트 높이: 추출할 텍스트의 최소 높이는 1024 x 768픽셀 이미지의 경우 12픽셀입니다. 이 차원은 인치당 150개 점의 약 8포인트 텍스트에 해당합니다.
- 사용자 지정 모델 학습: 학습 데이터의 최대 페이지 수는 사용자 지정 템플릿 모델의 경우 500개, 사용자 지정 신경망 모델의 경우 50,000개입니다.
- 사용자 지정 추출 모델 학습: 학습 데이터의 총 크기는 템플릿 모델의 경우 50MB, 신경망 모델의 경우 1GB입니다.
- 사용자 지정 분류 모델 학습: 학습 데이터의 총 크기는 1GB이며 최대 10,000페이지입니다. 2024-11-30(GA)의 경우 학습 데이터의 총 크기는 2GB이며 최대 10,000페이지입니다.
- Office 파일 형식(DOCX, XLSX, PPTX) : 최대 문자열 길이 제한은 8백만 자입니다.
세금 문서 데이터 추출을 사용해 보세요
고객 정보, 공급업체 세부 정보 및 라인 항목을 포함한 데이터가 청구서에서 추출되는 방법을 확인합니다. 다음 리소스가 필요합니다.
Azure 구독은 무료로 만들 수 있습니다.
Azure Portal의 Document Intelligence 인스턴스입니다. 무료 가격 책정 계층(
F0)을 사용하여 서비스를 시도할 수 있습니다. 리소스가 배포된 후 리소스로 이동을 선택하여 키 및 엔드포인트를 가져옵니다.
문서 인텔리전스 스튜디오
Document Intelligence Studio 홈페이지에서 지원되는 세금 문서 모델을 선택합니다.
샘플 세금 문서를 분석하거나 자체 파일을 업로드할 수 있습니다.
분석 실행 버튼을 선택하고 필요한 경우 분석 옵션을 구성합니다.
지원되는 언어 및 로캘
지원되는 언어의 전체 목록은 언어 지원 - 미리 빌드된 모델 페이지를 참조하세요.
필드 추출
지원되는 문서 추출 필드는 GitHub 샘플 리포지토리의 세금 문서 모델 스키마 페이지를 참조하세요.
추출된 세금 문서 키-값 쌍 및 품목은 JSON 출력의 documentResults 섹션에 있습니다.
다음 단계
문서 인텔리전스 스튜디오를 사용하여 사용자 고유의 양식 및 문서를 처리해 보세요.
Document Intelligence 빠른 시작을 완료하고 원하는 개발 언어로 문서 처리 앱 만들기를 시작해 보세요.