아쿠아포레스트 PDF
Aquaforest PDF 커넥터에는 Office 365 및 Power Automate에 대한 분할, 텍스트 추출, 바코드 추출 및 OCR 작업과 같은 다양한 PDF 작업을 수행하는 작업 그룹이 포함되어 있습니다.
이 커넥터는 다음 제품 및 지역에서 사용할 수 있습니다.
| 서비스 | 클래스 | Regions |
|---|---|---|
| Copilot Studio | Premium | 다음을 제외한 모든 Power Automate 지역 : - 미국 정부(GCC) - 미국 정부(GCC High) - 21Vianet에서 운영하는 중국 클라우드 - 미국 국방부(DoD) |
| 논리 앱 | 스탠다드 | 다음을 제외한 모든 Logic Apps 지역 : - Azure Government 지역 - Azure 중국 지역 - 미국 국방부(DoD) |
| Power Apps | Premium | 다음을 제외한 모든 Power Apps 지역 : - 미국 정부(GCC) - 미국 정부(GCC High) - 21Vianet에서 운영하는 중국 클라우드 - 미국 국방부(DoD) |
| Power Automate | Premium | 다음을 제외한 모든 Power Automate 지역 : - 미국 정부(GCC) - 미국 정부(GCC High) - 21Vianet에서 운영하는 중국 클라우드 - 미국 국방부(DoD) |
| 연락처 | |
|---|---|
| 이름 | 아쿠아포레스트 지원 |
| URL | https://www.aquaforest.com/en/aquaforest-flow-doc.asp |
| 전자 메일 | support@aquaforest.com |
| 커넥터 메타데이터 | |
|---|---|
| 게시자 | 아쿠아포레스트 제한 |
| 웹 사이트 | https://www.aquaforest.com/en/aquaforest-connector.asp |
| 개인 정보 보호 정책 | https://www.aquaforest.com/en/privacy policy.pdf |
| 카테고리 | 콘텐츠 및 파일; 데이터 |
Aquaforest PDF 커넥터에는 Office 365 및 Flow에 대한 분할, 텍스트 추출, 바코드 추출 및 OCR 작업과 같은 다양한 PDF 작업을 수행하는 작업 그룹이 포함되어 있습니다.
필수 조건
우선 Aquaforest PDF API 계정을 만들어야 합니다. 이 계정은 Aquaforest PDF 작업 및 Aquaforest PDF API를 관리하는 데 사용됩니다. 구독이 이 주소에 연결되므로 활성 전자 메일 주소를 사용합니다. 계정이 이미 있는 경우 여기에 로그인하기만 하면 됩니다.
자격 증명을 가져오는 방법
개발자 포털에 로그인하고 제품 페이지로 이동하여 구독하려는 제품을 선택합니다.

구독 단추를 클릭합니다.

확인 단추를 클릭하여 구독 요청 확인

프로필 페이지에서 API 키에 액세스할 수 있습니다.

연결을 만드는 중
커넥터는 다음 인증 유형을 지원합니다.
| 기본값 | 연결을 만들기 위한 매개 변수입니다. | 모든 지역 | 공유할 수 없음 |
기본값
적용 가능: 모든 지역
연결을 만들기 위한 매개 변수입니다.
공유 가능한 연결이 아닙니다. 전원 앱이 다른 사용자와 공유되면 다른 사용자에게 새 연결을 명시적으로 만들라는 메시지가 표시됩니다.
| 이름 | 유형 | Description | 필수 |
|---|---|---|---|
| API 키 | 시큐어스트링 (보안 문자열) | 이 API의 API 키 | 진실 |
제한 한도
| Name | 호출 | 갱신 기간 |
|---|---|---|
| 연결당 API 호출 | 100 | 60초 |
동작
| OCR PDF 또는 이미지 |
이미지 PDF 또는 스캔한 이미지에서 검색 가능한 PDF를 생성합니다. 자세한 내용은 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요. |
| PDF 속성 가져오기 |
PDF 파일에 대한 정보를 가져옵니다. |
| PDF에서 데이터 가져오기 |
이 작업은 키/값 쌍의 형태로 PDF 파일에서 중요한 데이터를 추출합니다. |
| PDF에서 텍스트 가져오기 |
텍스트 위치 및 정규식을 기반으로 PDF 파일에서 텍스트를 가져옵니다. 자세한 내용은 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요. |
| 바코드 값 가져오기 |
PDF에서 바코드를 가져옵니다. 자세한 내용은 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요. |
| 바코드로 PDF 분할 |
사용자가 정의한 바코드 일치 항목에 따라 PDF 파일을 분할합니다. 설명서를 보려면 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요. 또한 아쿠아포레스트 영역 추출 도구는 [https://www.aquaforest.com/en/zone/get-pdf-zone.html]에서 사용할 수 있습니다. |
| 바코드로 PDF 페이지 추출 |
사용자가 정의한 바코드 일치 항목을 기반으로 PDF 파일을 추출합니다. 자세한 내용은 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요. |
| 텍스트 일치로 PDF 분할 |
사용자가 정의한 텍스트 일치 항목에 따라 PDF 파일을 분할합니다. 설명서를 보려면 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요. 또한 아쿠아포레스트 영역 추출 도구는 [https://www.aquaforest.com/en/zone/get-pdf-zone.html]에서 사용할 수 있습니다. |
| 텍스트로 PDF 페이지 추출 |
사용자가 정의한 텍스트 일치 항목에 따라 PDF 파일을 추출합니다. 자세한 내용은 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요. |
| 페이지별로 PDF 분할 |
사용자가 정의한 분할 옵션에 따라 PDF 파일을 분할합니다. 설명서를 보려면 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요. |
OCR PDF 또는 이미지
이미지 PDF 또는 스캔한 이미지에서 검색 가능한 PDF를 생성합니다. 자세한 내용은 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요.
매개 변수
| Name | 키 | 필수 | 형식 | Description |
|---|---|---|---|---|
|
AquaforestImageTimeout
|
aquaforestImageTimeout | integer |
이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요. |
|
|
작성자
|
author | string |
출력 PDF 문서 속성에서 사용자 지정 작성자를 설정합니다. |
|
|
자동 회전
|
autorotate | boolean |
이미지를 자동으로 회전합니다. 이렇게 하면 모든 텍스트가 정상적으로 지향됩니다. |
|
|
이진
|
binarize | integer |
이 값은 일반적으로 기술 지원의 지침에 따라 사용해야 합니다. 색 이미지가 처리되는 방식을 제어하고 특정 임계값으로 이진화를 강제 적용할 수 있습니다. 일반적으로 테스트에 좋은 결과를 제공하기 위해 값 200이 표시되었지만 이는 "일반적인" 고객 문서로 확인되어야 합니다. 이를 -1 설정하면 텍스트를 배경 이미지나 색과 구분하는 대체 메서드가 사용됩니다. 이렇게 하면 신문 및 잡지 페이지와 같은 특정 문서에 대해 향상된 OCR 결과를 제공할 수 있습니다. |
|
|
검정 픽셀 제한
|
blackPixelLimit | float |
이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요. |
|
|
빈 페이지 임계값
|
blankPageThreshold | integer |
빈 페이지로 간주되지 않도록 이미지에 있어야 하는 "On Pixels"의 최소 수를 설정하려면 이 값을 사용합니다. -1 값은 빈 페이지 검색을 해제합니다. |
|
|
상자 크기
|
boxSize | integer |
이 옵션은 텍스트 주위의 상자가 그래픽으로 식별될 수 있는 양식에 적합합니다. 이 옵션은 OCR 엔진에서 사용하는 이미지의 임시 복사본에서 상자를 제거합니다. 최종 이미지에서 상자를 제거하지 않습니다. 기술적으로 이 옵션은 최소 영역(픽셀 단위 및 이 속성에 의해 정의됨)으로 연결된 요소를 제거합니다. 이 옵션은 현재 이중 색조 이미지에만 적용됩니다. |
|
|
ConvertToTiff
|
convertToTiff | boolean |
PDF 문서의 각 페이지는 TIFF 이미지로 래스터화됩니다. |
|
|
CreateProcess
|
createProcess | boolean |
pinvoke를 통해 프로세스를 시작하려면 이 값을 true로 설정합니다. |
|
|
만든 날짜
|
creationDate | string |
출력 PDF 문서 속성에서 사용자 지정 만들기 날짜를 설정합니다. 날짜 문자열은 'yyyy-MM-dd HH:mm:ss' 형식이어야 합니다. |
|
|
Deskew
|
deskew | boolean |
Deskew(곧게) 이미지를 만듭니다. |
|
|
Despeckle
|
despeckle | integer |
이렇게 하면 이미지 내의 연결이 끊긴 모든 요소가 지정된 그림보다 작은 픽셀 단위로 높이 또는 너비가 제거됩니다. 최대값은 9이고 기본값은 0입니다. |
|
|
DictionaryLookup
|
dictionaryLookup | integer |
이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요. |
|
|
Dotmatrix
|
dotmatrix | boolean |
점 행렬 글꼴의 인식을 향상 하려면이 true로 설정 합니다. 기본값은 거짓입니다. 점 행렬이 아닌 글꼴에 대해 true로 설정하면 인식이 저하될 수 있습니다. |
|
|
디버그 출력 사용
|
enableDebugOutput | boolean |
디버그 출력을 사용하도록 설정합니다. |
|
|
PDF 압축(MRC)
|
enableMrc | boolean |
이를 통해 혼합 래스터 압축을 사용하면 색 스캔으로 구성된 PDF의 출력 크기를 크게 줄일 수 있습니다. 이 옵션은 원본이 PDF가 아니거나 ConvertToTiff를 사용하는 경우에만 적합합니다. |
|
|
PDF/A 출력
|
enablePDFAOutput | boolean |
PDF/A로 출력할지 여부입니다. |
|
|
오류 모드
|
errorMode | integer |
이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요. |
|
|
원본 파일 콘텐츠
|
fileContent | True | byte |
OCR에 대한 파일의 내용 |
|
확장명을 가진 원본 파일 이름
|
fileNameWithExtension | True | string |
확장명 또는 확장명만 있는 원본 파일 이름(선행 기간 '.') |
|
대칭 이동 감지
|
flipDetect | integer |
이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요. |
|
|
회색조 품질
|
grayscaleQuality | integer |
이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요. |
|
|
경험적 학습
|
heuristics | integer |
이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요. |
|
|
Jbig2EncFlags
|
jbig2EncFlags | string |
이러한 플래그는 PDF 생성에 사용되는 JBIG2 버전의 이미지를 생성하는 데 사용되는 애플리케이션에 전달됩니다(이 압축을 사용하도록 설정되었다고 가정). 이 옵션은 일반적으로 기술 지원의 지침에 따라 사용해야 합니다. |
|
|
Language
|
language | enum |
아래 옵션 중 하나를 선택하면 OCR 처리에 사용할 언어가 설정됩니다. 기본 언어는 한국어(Korean)입니다. |
|
|
LibTiffSavePageAsBmp
|
libTiffSavePageAsBmp | boolean |
경우에 따라 1bpp이고 LZW 압축이 있는 이미지가 있는 경우 사전 처리로 인해 이미지의 색상이 반전될 수 있습니다(검은색에서 흰색, 흰색에서 검은색으로). 이를 방지하려면 true로 설정합니다. |
|
|
최대 책상
|
maxDeskew | float |
페이지를 책상에 배치할 최대 각도입니다. 이 옵션은 일반적으로 기술 지원(support@aquaforest.com)의 지침에 따라만 사용해야 합니다. |
|
|
최소 데스크슈 신뢰도
|
minDeskewConfidence | float |
이 옵션은 일반적으로 기술 지원(support@aquaforest.com)의 지침에 따라만 사용해야 합니다. |
|
|
수정된 날짜
|
modifiedDate | string |
출력 PDF 문서 속성에서 사용자 지정 수정 날짜를 설정합니다. 날짜 문자열은 'yyyy-MM-dd HH:mm:ss' 형식이어야 합니다. |
|
|
모핑 (Morph)
|
morph | string |
OCR 전에 이진화된 이미지에 적용할 형태학적 옵션입니다. 빈 값으로 설정하면 아무 것도 적용되지 않습니다. 일반적인 옵션에는 아래에 나열된 옵션이 포함되어 있지만 더 많은 옵션은 문의 support@aquaforest.com하세요. |
|
|
MrcBackgroundFactor
|
mrcBackgroundFactor | integer |
이미지의 배경 부분에 대한 샘플링 크기입니다. 숫자가 높을수록 평균에 사용되는 이미지 블록의 크기가 클수록 크기가 감소하고 품질도 저하됩니다. 기본값은 3입니다. |
|
|
MrcForegroundFactor
|
mrcForegroundFactor | integer |
이미지의 전경 부분에 대한 샘플링 크기입니다. 숫자가 높을수록 평균에 사용되는 이미지 블록의 크기가 클수록 크기가 감소하고 품질도 저하됩니다. 기본값은 3입니다. |
|
|
MrcQuality
|
mrcQuality | integer |
배경 및 전경 이미지를 저장하는 데 사용할 JPEG 품질 설정(백분율 값 1 - 100)입니다. 기본값은 75입니다. |
|
|
MrcTimeout
|
mrcTimeout | integer |
이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요. |
|
|
NoPictures
|
noPictures | boolean |
기본적으로 문서의 영역이 그래픽 영역으로 식별되면 해당 영역에서 OCR 처리가 실행되지 않습니다. 그러나 특정 문서에는 "그래픽" 또는 "그림" 영역으로 식별되지만 실제로 유용한 텍스트가 포함된 영역이나 상자가 포함될 수 있습니다. NoPictures를 True로 설정하면 그림으로 식별된 영역이 무시되고 False로 설정하면 그림으로 식별된 영역의 OCR이 강제로 적용됩니다. |
|
|
OcrProcessSetupTimeout
|
ocrProcessSetupTimeout | integer |
이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요. |
|
|
OcrTimeout
|
ocrTimeout | integer |
이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요. |
|
|
암호
|
password | string |
원본 PDF 파일을 여는 암호입니다. |
|
|
PdfToImageBpp
|
pdfToImageBpp | enum |
엔진 1을 사용할 때 래스터화된 PDF 페이지에 사용할 픽셀당 비트입니다. ConvertToTiff를 사용하여 처리되는 문서에만 적용됩니다. 이 속성의 기본값은 PDF 페이지에서 가져옵니다. |
|
|
PdfToImageCompression
|
pdfToImageCompression | enum |
원본 PDF 파일의 각 페이지에서 추출되거나 래스터화된 이미지로 설정할 압축입니다. 그런 다음 이러한 이미지를OCRed하여 검색 가능한 PDF를 만듭니다. 이 속성의 기본값은 원본 PDF 파일의 각 페이지에서 가져옵니다. |
|
|
PdfToImageDpi
|
pdfToImageDpi | enum |
원본 PDF 파일의 각 페이지에서 래스터화된 이미지로 설정할 DPI입니다. 그런 다음 이러한 이미지를OCRed하여 검색 가능한 PDF를 만듭니다. 이 속성의 기본값은 원본 PDF 파일의 각 페이지에서 가져옵니다. |
|
|
PdfToImageForceVectorCheck
|
pdfToImageForceVectorCheck | boolean |
이 설정은 벡터 개체가 포함된 문서(예: CAD 드로잉)를 처리할 때 유용합니다. 기본적으로 벡터 개체만 포함된 페이지는 래스터화됩니다. 이미지가 없지만 벡터 개체와 전자 텍스트를 포함하는 페이지는 래스터화에서 건너뜁습니다. 그러나 경우에 따라 벡터 개체(CAD 드로잉)를 포함하는 페이지가 있을 수 있지만 제목은 전자 텍스트에 있을 수 있습니다. 이와 같이 페이지를 강제로 래스터화하려면 이 속성을 true로 설정합니다. |
|
|
PdfToImageIncludeText
|
pdfToImageIncludeText | boolean |
False로 설정하면 실제 텍스트(즉, 스캔된 이미지의 일부인 텍스트가 아닌 전자적으로 생성됨)의 변환이 PDF에서 추출된 페이지 이미지에 렌더링되지 않습니다. 텍스트가 이미 검색 가능하므로 일반적으로 OCR이 필요하지 않기 때문입니다. 그러나 이 실제 텍스트에 OCR이 필요한 경우 값을 True로 설정할 수 있습니다. |
|
|
PdfToImageMaxRes
|
pdfToImageMaxRes | integer |
래스터화된 이미지의 최대 해상도입니다. PDF 페이지에서 검색된 해상도가 이 값보다 크면 이 값으로 설정됩니다. 이 속성의 기본값은 600입니다. |
|
|
PdfToImageMinRes
|
pdfToImageMinRes | integer |
래스터화된 이미지의 최소 해상도입니다. PDF 페이지에서 검색된 해상도가 이 값보다 낮으면 이 값으로 설정됩니다. 이 속성의 기본값은 200입니다. |
|
|
PDF/A 버전
|
pdfaVersion | enum |
PDF/A 버전입니다. |
|
|
PipeClientConnectionTimeout
|
pipeClientConnectionTimeout | integer |
이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요. |
|
|
RemoveBlankPage
|
removeBlankPage | boolean |
BlankPageThreshold가 -1보다 크고 ConvertToTiff가 true인 경우 빈 페이지를 제거합니다. |
|
|
RemoveLines
|
removeLines | boolean |
이미지에서 선 제거 fpr 더 나은 인식. |
|
|
RestartEngineEvery
|
restartEngineEvery | integer |
이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요. |
|
|
책갈피 유지
|
retainBookmarks | boolean |
ConvertToTiff를 사용할 때 출력의 원본 파일에서 책갈피를 유지합니다. |
|
|
생성 날짜 유지
|
retainCreationDate | boolean |
출력 PDF 문서 속성에서 원본 파일의 생성 날짜를 유지합니다. |
|
|
메타데이터 보존
|
retainMetadata | boolean |
ConvertToTiff를 사용할 때 출력의 원본 파일에서 메타데이터를 유지합니다. |
|
|
수정된 날짜 유지
|
retainModifiedDate | boolean |
원본 파일의 수정된 날짜를 출력 PDF 문서 속성에 유지합니다. |
|
|
뷰어 기본 설정 유지
|
retainViewerPreferences | boolean |
ConvertToTiff를 사용할 때 출력의 원본 파일에서 PDF 뷰어 기본 설정, 페이지 모드 및 페이지 레이아웃을 유지합니다. |
|
|
SavePredespeckle
|
savePredespeckle | boolean |
출력 PDF에서 원본 이미지(예: 사전 처리를 적용하기 전)를 사용합니다. |
|
|
Tables
|
tables | boolean |
true로 설정하면 표 셀 내에서 OCR을 시도합니다. |
|
|
TextLayerFilterHeight
|
textLayerFilterHeight | integer |
이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요. |
|
|
TextLayerFilterHeightInverted
|
textLayerFilterHeightInverted | integer |
이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요. |
|
|
TextLayerFilterPercentage
|
textLayerFilterPercentage | float |
이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요. |
|
|
TextLayerFilterPercentageInverted
|
textLayerFilterPercentageInverted | float |
이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요. |
|
|
TextLayerFilterRatio
|
textLayerFilterRatio | float |
이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요. |
|
|
TextLayerFilterRatioInverted
|
textLayerFilterRatioInverted | float |
이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요. |
|
|
TextLayerFilterWidth
|
textLayerFilterWidth | integer |
이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요. |
|
|
TextLayerFilterWidthInverted
|
textLayerFilterWidthInverted | integer |
이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요. |
|
|
TextLayerMaxBoxes
|
textLayerMaxBoxes | integer |
이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요. |
|
|
정리 모드
|
tidyUpMode | integer |
이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요. |
|
|
PDF/A 유효성 검사
|
validatePDFA | boolean |
변환 후 PDF/A 문서의 유효성을 검사할지 여부 |
|
|
Word 일치 임계값
|
wordMatchThreshold | float |
이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요. |
반환
OCR 작업에 대한 응답 데이터
PDF 속성 가져오기
PDF 파일에 대한 정보를 가져옵니다.
매개 변수
| Name | 키 | 필수 | 형식 | Description |
|---|---|---|---|---|
|
File Content(파일 내용)
|
fileContent | True | byte |
원본 파일의 내용 |
|
페이지 제한
|
pageLimit | integer |
처리할 최대 페이지 수이며, 페이지에 숨겨진 텍스트가 포함되어 있는지 확인하거나 PDF를 검색할 수 있는지 확인하는 데만 사용됩니다. |
반환
PDF에서 데이터 가져오기
이 작업은 키/값 쌍의 형태로 PDF 파일에서 중요한 데이터를 추출합니다.
매개 변수
| Name | 키 | 필수 | 형식 | Description |
|---|---|---|---|---|
|
이름
|
settingName | True | string |
여기에 설정의 이름을 입력합니다. |
|
가치
|
settingValue | True | string |
여기에 설정 값을 입력합니다. |
|
신뢰도 점수
|
confidenceScore | number |
신뢰도가 낮은 값을 필터링하려면 더 높은 신뢰도 점수를 설정합니다. 0에서 1 사이의 값을 설정할 수 있습니다. 0.5부터 시작하는 것이 좋습니다. |
|
|
날짜 변환
|
dateAsISO | string |
날짜 값을 반환할 형식 선택 |
|
|
필요한 키
|
expectedKeys | string |
JSON을 구문 분석하지 않고 이후 작업에서 값을 사용할 수 있도록 줄당 하나의 키 이름을 제공합니다. |
|
|
File Content(파일 내용)
|
fileContent | True | byte |
원본 파일의 내용 |
|
페이지 제한
|
pageLimit | integer |
처리할 최대 페이지 수 |
|
|
페이지 범위
|
pageRange | string |
처리하려는 페이지 번호의 문자열 표현입니다. 예: 1,3-4 |
|
|
통화 기호 제거
|
stripCurrencySymbol | boolean |
통화 값을 반환하기 전에 기호와 문자열을 제거하려면 이 값을 true로 설정합니다. |
|
|
일치 동의어
|
synonym | boolean |
동의어인 모든 키를 예상 키로 반환하려면 이 값을 true로 설정합니다. |
|
|
동의어 사전
|
synonymDictionary | string |
각 개체에 배열의 동의어 목록이 포함된 "entry" 개체의 JSON 배열을 제공할 수 있습니다. 예를 들어 "청구서 번호" 및 "청구서 번호"(대/소문자를 구분하지 않음)를 동일한 키로 해석하려면 [{'entry': [ 'Invoice No', 'invoice number' ]}] JSON을 사용합니다. |
|
|
기호 자르기
|
trimSymbols | boolean |
필요한 키와 일치하기 전에 찾은 키에서 선행 기호와 후행 기호를 모두 제거하려면 이 값을 true로 설정합니다. |
반환
PDF에서 텍스트 가져오기
텍스트 위치 및 정규식을 기반으로 PDF 파일에서 텍스트를 가져옵니다. 자세한 내용은 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요.
매개 변수
| Name | 키 | 필수 | 형식 | Description |
|---|---|---|---|---|
|
File Content(파일 내용)
|
fileContent | True | byte |
원본 파일의 내용 |
|
텍스트 일치 서식 파일 없음
|
noTextTemplate | True | string |
일치하는 항목을 찾을 수 없는 경우 반환할 텍스트에 대한 템플릿 |
|
페이지 구분 기호
|
pageSeparator | string |
페이지 나누기가 있는 위치를 알 수 있도록 페이지 구분 기호를 제공합니다. |
|
|
페이지
|
pagerange | string |
텍스트를 추출할 페이지 범위를 제공합니다. 단일 페이지 번호(1), 쉼표로 구분된 여러 페이지 번호(1,2,3), 페이지 범위(1-4) 또는 모두의 혼합(1,2,4-7)일 수 있습니다. |
|
|
파일 이름
|
sourceFileName | True | string |
원본 파일의 이름입니다. |
|
텍스트 결과 템플릿
|
textResultTemplate | True | string |
일치하는 항목이 발견되면 반환할 텍스트에 대한 템플릿 |
|
가치
|
expression | array of string |
위의 속성과 함께 사용할 값을 하나 이상 입력합니다. 위에 명시된 규칙과 일치하는 첫 번째 텍스트 값을 반환합니다. |
|
|
위치
|
location | True | string |
페이지의 영역 - 영역 도구를 사용하여 좌표를 가져옵니다. [https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
페이지(사용되지 않음)
|
pagenumber | integer |
이 속성은 사용되지 않습니다. Pages 속성을 사용하는 것이 좋습니다. Pages 속성은 모든 영역에 적용되며 처리할 페이지를 선택할 수 있습니다. |
|
|
선택
|
position | string |
이를 사용하여 더 많은 추출 텍스트를 구체화하고 요구 사항과 일치하는 옵션을 선택합니다. |
|
|
패턴
|
regex | string |
여기에 정규식이 제공되면 추출된 텍스트를 일치시키고 일치 항목을 반환합니다. |
반환
바코드 값 가져오기
PDF에서 바코드를 가져옵니다. 자세한 내용은 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요.
매개 변수
| Name | 키 | 필수 | 형식 | Description |
|---|---|---|---|---|
|
바코드 결과 템플릿
|
barcodeResultTemplate | True | string |
바코드를 찾은 경우 출력 텍스트 결과에 대한 템플릿 |
|
File Content(파일 내용)
|
fileContent | True | byte |
원본 파일의 내용 |
|
바코드 템플릿 없음
|
noBarcodeTemplate | True | string |
바코드를 찾을 수 없는 경우 출력 텍스트 결과에 대한 템플릿 |
|
페이지 구분 기호
|
pageSeparator | string |
페이지 나누기가 있는 위치를 알 수 있도록 페이지 구분 기호를 제공합니다. |
|
|
페이지
|
pagerange | string |
텍스트를 추출할 페이지 범위를 제공합니다. 단일 페이지 번호(1), 쉼표로 구분된 여러 페이지 번호(1,2,3), 페이지 범위(1-4) 또는 모두의 혼합(1,2,4-7)일 수 있습니다. |
|
|
파일 이름
|
sourceFileName | True | string |
원본 파일의 이름입니다. |
|
유형
|
barcodeFormats | array of string |
식별할 바코드 유형 지정 |
|
|
위치
|
location | True | string |
페이지의 영역 - 영역 도구를 사용하여 좌표를 가져옵니다. [https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
페이지(사용되지 않음)
|
pagenumber | integer |
이 속성은 사용되지 않습니다. Pages 속성을 사용하는 것이 좋습니다. Pages 속성은 모든 영역에 적용되며 처리할 페이지를 선택할 수 있습니다. |
|
|
패턴
|
regex | string |
여기에 정규식이 제공되면 추출된 텍스트를 일치시키고 일치 항목을 반환합니다. |
반환
바코드로 PDF 분할
사용자가 정의한 바코드 일치 항목에 따라 PDF 파일을 분할합니다. 설명서를 보려면 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요. 또한 아쿠아포레스트 영역 추출 도구는 [https://www.aquaforest.com/en/zone/get-pdf-zone.html]에서 사용할 수 있습니다.
매개 변수
| Name | 키 | 필수 | 형식 | Description |
|---|---|---|---|---|
|
File Content(파일 내용)
|
fileContent | True | byte |
원본 파일의 내용 |
|
파일 이름 템플릿
|
fileNameTemplate | True | string |
바코드가 있는 경우 출력 파일에 대한 템플릿 |
|
일치하는 항목이 없는 페이지
|
noMatch | string |
위에서 선택한 분할 옵션에 따라 일부 페이지에는 바코드 값이 없습니다. 이러한 페이지를 수행할 작업을 선택합니다. |
|
|
바코드 일치 템플릿 없음
|
noTextFileName | True | string |
바코드를 찾을 수 없는 경우 출력 파일에 대한 템플릿 |
|
파일 이름
|
sourceFileName | True | string |
원본 파일의 이름입니다. |
|
출력 파일 옵션
|
splitOption | string |
이를 사용하여 더 많은 추출 텍스트를 구체화하고 요구 사항과 일치하는 옵션을 선택합니다. |
|
|
유형
|
barcodeFormats | array of string |
식별할 바코드 유형 지정 |
|
|
위치
|
location | True | string |
페이지의 영역 - 영역 도구를 사용하여 좌표를 가져옵니다. [https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
패턴
|
regex | string |
여기에 정규식이 제공되면 추출된 바코드를 일치시키고 일치 항목을 반환합니다. |
반환
바코드로 PDF 페이지 추출
사용자가 정의한 바코드 일치 항목을 기반으로 PDF 파일을 추출합니다. 자세한 내용은 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요.
매개 변수
| Name | 키 | 필수 | 형식 | Description |
|---|---|---|---|---|
|
File Content(파일 내용)
|
fileContent | True | byte |
원본 파일의 내용 |
|
파일 이름 템플릿
|
fileNameTemplate | True | string |
바코드가 있는 경우 출력 파일에 대한 템플릿 |
|
파일 템플릿 없음
|
noTextFileName | True | string |
바코드를 찾을 수 없는 경우 출력 파일에 대한 템플릿 |
|
파일 이름
|
sourceFileName | True | string |
원본 파일의 이름입니다. |
|
유형
|
barcodeFormats | array of string |
식별할 바코드 유형 지정 |
|
|
위치
|
location | True | string |
페이지의 영역 - 영역 도구를 사용하여 좌표를 가져옵니다. [https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
패턴
|
regex | string |
여기에 정규식이 제공되면 추출된 바코드를 일치시키고 일치 항목을 반환합니다. |
반환
텍스트 일치로 PDF 분할
사용자가 정의한 텍스트 일치 항목에 따라 PDF 파일을 분할합니다. 설명서를 보려면 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요. 또한 아쿠아포레스트 영역 추출 도구는 [https://www.aquaforest.com/en/zone/get-pdf-zone.html]에서 사용할 수 있습니다.
매개 변수
| Name | 키 | 필수 | 형식 | Description |
|---|---|---|---|---|
|
File Content(파일 내용)
|
fileContent | True | byte |
원본 파일의 내용 |
|
파일 이름 템플릿
|
fileNameTemplate | True | string |
텍스트가 일치하는 경우 출력 파일에 대한 템플릿 |
|
일치하는 항목이 없는 페이지
|
noMatch | string |
위에서 선택한 분할 옵션에 따라 일부 페이지에는 추출된 텍스트 값이 없습니다. 이러한 페이지를 수행할 작업을 선택합니다. |
|
|
파일 템플릿 없음
|
noTextFileName | True | string |
텍스트 일치 항목이 없는 경우 출력 파일에 대한 템플릿 |
|
파일 이름
|
sourceFileName | True | string |
원본 파일의 이름입니다. |
|
출력 파일 옵션
|
splitOption | string |
분할 작업에서 출력 파일의 바코드가 있는 페이지의 위치를 선택합니다. |
|
|
가치
|
expression | array of string |
위의 속성과 함께 사용할 값을 하나 이상 입력합니다. 위에 명시된 규칙과 일치하는 첫 번째 텍스트 값을 반환합니다. |
|
|
위치
|
location | True | string |
페이지의 영역 - 영역 도구를 사용하여 좌표를 가져옵니다. [https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
선택
|
position | string |
이를 사용하여 더 많은 추출 텍스트를 구체화하고 요구 사항과 일치하는 옵션을 선택합니다. |
|
|
패턴
|
regex | string |
여기에 정규식이 제공되면 추출된 텍스트를 일치시키고 일치 항목을 반환합니다. |
반환
텍스트로 PDF 페이지 추출
사용자가 정의한 텍스트 일치 항목에 따라 PDF 파일을 추출합니다. 자세한 내용은 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요.
매개 변수
| Name | 키 | 필수 | 형식 | Description |
|---|---|---|---|---|
|
File Content(파일 내용)
|
fileContent | True | byte |
원본 파일의 내용 |
|
파일 이름 템플릿
|
fileNameTemplate | True | string |
텍스트가 일치하는 경우 출력 파일에 대한 템플릿 |
|
파일 템플릿 없음
|
noTextFileName | True | string |
텍스트 일치 항목이 없는 경우 출력 파일에 대한 템플릿 |
|
파일 이름
|
sourceFileName | True | string |
원본 파일의 이름입니다. |
|
가치
|
expression | array of string |
위의 속성과 함께 사용할 값을 하나 이상 입력합니다. 위에 명시된 규칙과 일치하는 첫 번째 텍스트 값을 반환합니다. |
|
|
위치
|
location | True | string |
페이지의 영역 - 영역 도구를 사용하여 좌표를 가져옵니다. [https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
선택
|
position | string |
이를 사용하여 더 많은 추출 텍스트를 구체화하고 요구 사항과 일치하는 옵션을 선택합니다. |
|
|
패턴
|
regex | string |
여기에 정규식이 제공되면 추출된 텍스트를 일치시키고 일치 항목을 반환합니다. |
반환
페이지별로 PDF 분할
사용자가 정의한 분할 옵션에 따라 PDF 파일을 분할합니다. 설명서를 보려면 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요.
매개 변수
| Name | 키 | 필수 | 형식 | Description |
|---|---|---|---|---|
|
File Content(파일 내용)
|
fileContent | True | byte |
원본 파일의 내용입니다. |
|
출력 파일 이름
|
fileNameTemplate | True | string |
%UNIQUEn(1부터 시작하여 n자리로 채워진 고유 번호) 및 %FILENAME(확장명 없는 원래 파일 이름)을 포함할 수 있는 대상 파일 템플릿입니다. |
|
파일 이름
|
sourceFileName | True | string |
원본 파일의 이름입니다. |
|
분할 형식
|
splitOption | True | string |
각 파일에 사용할 분할 작업을 선택합니다. |
|
페이지 범위
|
pageRange | string |
원본에서 추출할 페이지를 정의하는 쉼표로 구분된 페이지 범위 집합입니다. |
|
|
모든 반복
|
repeatEvery | integer |
문서 내의 각 페이지 범위 페이지에 페이지 범위를 적용합니다. 예를 들어 페이지 범위에 대해 2-4를 지정하고 4를 반복 범위로 지정하면 4페이지마다 범위가 다시 적용됩니다. |
|
|
책갈피 유지
|
retainBookmarks | boolean |
생성된 파일에는 원래 파일의 책갈피가 포함됩니다. |
|
|
메타데이터 보존
|
retainMetadata | boolean |
생성된 파일에는 원본 파일의 메타데이터(예: 작성자 및 제목)가 포함됩니다. |
반환
정의
ApiExtractPost200ApplicationJsonResponse
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
오류
|
ErrorMessage | string |
Is Successful 값이 false이면 오류 메시지가 반환됩니다. |
|
성공
|
IsSuccessful | boolean |
하나 이상의 페이지가 추출된 경우 true가 반환됩니다. |
|
라이선스 정보
|
LicenceInfo | string |
API 구독 키에 대한 정보 |
|
출력 파일 추출
|
SplittedFile | array of object |
추출된 파일의 배열 |
|
(파일 콘텐츠)
|
SplittedFile.SplitFileContent | byte |
파일 콘텐츠를 나타내는 base 64 문자열 |
|
(파일 이름)
|
SplittedFile.SplitFileName | string |
생성된 파일 이름을 포함하는 문자열 |
|
(페이지 번호)
|
SplittedFile.pageNumber | string |
추출이 발생한 페이지 번호를 포함하는 페이지 범위입니다. |
ApiGetTextValueJsonResponse
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
오류 메시지
|
ErrorMessage | string |
Is Successful 값이 false이면 오류 메시지가 반환됩니다. |
|
성공
|
IsSuccessful | boolean |
텍스트가 성공적으로 일치하는 경우 |
|
라이선스 정보
|
LicenceInfo | string |
API 구독 키에 대한 정보 |
|
텍스트 결과
|
TextResult | string |
추출된 텍스트를 제공된 텍스트 결과 템플릿에 적용하여 생성된 문자열입니다. 페이지 수가 1보다 큰 경우 페이지 구분 기호를 사용하여 모든 페이지를 연결합니다. |
|
Results
|
TextResults | array of object |
페이지 목록 및 추출된 텍스트 값이 포함된 배열 |
|
(페이지 번호)
|
TextResults.pageNumber | string |
텍스트가 발견된 페이지 |
|
(페이지 텍스트)
|
TextResults.valueExtracted | string |
추출된 텍스트를 제공된 텍스트 결과 템플릿에 적용하여 생성된 문자열입니다. |
|
(영역 값)
|
TextResults.zoneValues | array of string |
각 영역에서 추출된 텍스트를 포함하는 배열입니다. |
ApiRenameByBarcodePost200ApplicationJsonResponse
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
바코드
|
BarcodeResult | string |
추출된 텍스트를 제공된 바코드 결과 템플릿에 적용하여 생성된 문자열입니다. 페이지 수가 1보다 큰 경우 페이지 구분 기호를 사용하여 모든 페이지를 연결합니다. |
|
Results
|
BarcodeResults | array of object |
페이지 목록 및 추출된 바코드 값이 포함된 배열 |
|
(페이지 번호)
|
BarcodeResults.pageNumber | string |
바코드가 발견된 페이지 |
|
(페이지 바코드)
|
BarcodeResults.valueExtracted | string |
추출된 바코드 값을 제공된 바코드 결과 템플릿에 적용하여 생성된 문자열입니다. |
|
(영역 값)
|
BarcodeResults.zoneValues | array of string |
각 영역에서 추출된 바코드를 포함하는 배열입니다. |
|
오류 메시지
|
ErrorMessage | string |
Is Successful 값이 false이면 오류 메시지가 반환됩니다. |
|
성공
|
IsSuccessful | boolean |
바코드가 검색된 경우 |
|
라이선스 정보
|
LicenceInfo | string |
API 구독 키에 대한 정보 |
ApiSplitPost200ApplicationJsonResponse
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
오류 메시지
|
ErrorMessage | string |
Is Successful 값이 false이면 오류 메시지가 반환됩니다. |
|
성공
|
IsSuccessful | boolean |
하나 이상의 분할 페이지가 일치하는 경우 true가 반환됩니다. |
|
라이선스 정보
|
LicenceInfo | string |
API 구독 키에 대한 정보 |
|
출력 파일 분할
|
SplittedFile | array of object |
생성된 파일 이름 및 페이지 번호와 같은 세부 정보와 함께 각 분할 파일을 포함하는 배열입니다. |
|
(파일 콘텐츠)
|
SplittedFile.SplitFileContent | byte |
파일 콘텐츠를 나타내는 base 64 문자열 |
|
(파일 이름)
|
SplittedFile.SplitFileName | string |
생성된 파일 이름을 포함하는 문자열 |
|
(페이지 범위)
|
SplittedFile.pageNumber | string |
분할 작업의 페이지 번호를 포함하는 페이지 범위 |
GetPDFInfoResponse
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
어셈블리 허용
|
AllowAssembly | boolean |
페이지의 회전, 삽입 또는 삭제를 허용합니다. |
|
성능 저하 인쇄 허용
|
AllowDegradedPrinting | boolean |
저품질 인쇄를 허용합니다. |
|
콘텐츠 추출 허용
|
AllowExtractContents | boolean |
텍스트 및 그래픽 추출을 허용합니다. |
|
접근성을 위해 추출 허용
|
AllowExtractForAccessibility | boolean |
접근성을 지원하기 위해 텍스트 및 그래픽 추출을 허용합니다. |
|
양식 채우기 허용
|
AllowFillInForm | boolean |
양식 필드 채우기를 허용합니다. |
|
주석 수정 허용
|
AllowModifyAnnotations | boolean |
주석 수정을 허용합니다. |
|
내용 수정 허용
|
AllowModifyContents | boolean |
콘텐츠 수정을 허용합니다. |
|
인쇄 허용
|
AllowPrinting | boolean |
고품질 인쇄를 허용합니다. |
|
작성자
|
Author | string |
문서를 만든 사람입니다. |
|
만든 날짜
|
CreationDate | string |
PDF를 만든 날짜와 시간입니다. |
|
작성자
|
Creator | string |
원래 애플리케이션 또는 라이브러리입니다. |
|
오류 메시지
|
ErrorMessage | string |
Is Successful 값이 false이면 오류 메시지가 반환됩니다. |
|
파일 크기(바이트)
|
FileSize | number |
파일 크기(바이트) |
|
숨겨진 텍스트가 있습니다.
|
HasHiddenText | boolean |
PDF 파일에 OCR 계층이 있는 경우 true가 반환됩니다. |
|
암호화됨
|
IsEncrypted | boolean |
이 문서가 암호화되었는지 여부에 따라 true가 반환됩니다. |
|
검색 가능
|
IsSearchable | boolean |
PDF 파일을 검색할 수 있는 경우 true가 반환됩니다. |
|
성공
|
IsSuccessful | boolean |
작업이 성공하면 true를 반환합니다. |
|
키워드
|
Keywords | string |
키워드는 쉼표로 구분할 수 있습니다. |
|
라이선스 정보
|
LicenceInfo | string |
구독 할당량의 Json 요약입니다. |
|
수정된 날짜
|
ModifiedDate | string |
이 속성은 PDF가 마지막으로 수정된 날짜와 시간을 나타냅니다. |
|
페이지 수
|
NumberofPages | integer |
PDF 파일의 페이지 수입니다. |
|
PDF 버전
|
PDFversion | number |
문서가 빌드된 PDF 사양의 버전입니다. |
|
Producer
|
Producer | string |
PDF를 만든 제품입니다. PDF 초기에는 Microsoft Word와 같은 Creator 응용 프로그램을 사용하여 문서를 작성하고, PostScript 파일에 인쇄한 다음, 생산자는 PostScript 파일을 PDF로 변환한 응용 프로그램인 Acrobat 증류소가 됩니다. 요즘 작성자와 생산자는 동일하거나 하나의 필드가 비어 있는 경우가 많습니다. |
|
주제
|
Subject | string |
문서에 대한 내용입니다. |
|
제목
|
Title | string |
문서의 제목입니다. |
|
갇혀
|
Trapped | string |
이 속성은 문서가 트래핑되었는지 여부를 나타내는 부울 값입니다. 트래핑은 잠재적인 레지스터 오류를 모호하게 하기 위해 색 영역을 색 구분에 도입하는 사전 누르기 프로세스입니다. |
|
XMP 메타데이터
|
XmpMetadata | string |
XMP(Extensible Metadata Platform)는 디지털 문서 및 데이터 집합에 대한 표준화된 사용자 지정 메타데이터의 생성, 처리 및 교환을 위해 원래 Adobe Systems Inc.에서 만든 ISO 표준입니다. |
ocr_response
OCR 작업에 대한 응답 데이터
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
오류 메시지
|
ErrorMessage | string |
Is Successful 값이 false이면 오류 메시지가 반환됩니다. |
|
성공
|
IsSuccessful | boolean |
OCR이 성공하면 true를 반환합니다. |
|
라이선스 정보
|
LicenceInfo | string |
API 구독 키에 대한 정보 |
|
로그 파일 콘텐츠
|
LogFileContent | byte |
작업의 로그 내용 |
|
처리된 파일 콘텐츠
|
OutputFileContent | byte |
Aquaforest PDF 변환기에서 생성된 파일입니다. |