このコンテンツの適用対象:
v4.0 (GA)
Document Intelligenceの 住宅ローン モデルでは、強力な光学式文字認識 (OCR) 機能とディープ ラーニング モデルを使用して、住宅ローン ドキュメントの主要なフィールドを分析して抽出します。 住宅ローンのドキュメントには、さまざまな形式と品質のものがあります。 API により、住宅ローン ドキュメントが分析され、構造化された JSON データ表現が返されます。 このモデルでは、現在、英語のドキュメントをサポートしています。 最新の V4.0 では、住宅ローンの申請書やフォームから署名を抽出できるようになりました。
サポートされているドキュメントの種類:
- 統一住宅ローン申請書 (様式 1003)
- 統一住宅評価報告書 (フォーム 1004)
- 在籍証明書フォーム (フォーム 1005)
- 統一引受転送概要書 (様式 1008)
- 決算開示様式
開発オプション
Document Intelligence v4.0 (2024-11-30-GA) では、以下のツール、アプリケーション、ライブラリがサポートされています。
| 特徴量 | リソース | モデル ID |
|---|---|---|
| 住宅ローン モデル | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
• prebuilt-mortgage.us.1003 • prebuilt-mortgage.us.1004 • prebuilt-mortgage.us.1005 • prebuilt-mortgage.us.1008 • prebuilt-mortgage.us.closingDisclosure |
入力の要件
次のファイル形式がサポートされています。
| モデル | 画像: JPEG/JPG、PNG、BMP、TIFF、HEIF |
Office: Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML |
|
|---|---|---|---|
| Read | ✔ | ✔ | ✔ |
| レイアウト | ✔ | ✔ | ✔ |
| 一般ドキュメント | ✔ | ✔ | |
| 事前構築済み | ✔ | ✔ | |
| カスタム抽出 | ✔ | ✔ | |
| カスタム分類 | ✔ | ✔ | ✔ |
- 写真とスキャン: 最適な結果を得るには、ドキュメントごとに 1 つの鮮明な写真または高品質のスキャンを用意します。
- PDF と TIFF: PDF とTIFF の場合、最大 2,000 ページを処理できます。 (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます。)
- ファイル サイズ: ドキュメントを分析するためのファイル サイズは、有料 (S0) レベルでは 500 MB、Free (F0) レベルでは 4 MB です。
- 画像の寸法: 寸法は、50 ピクセル x 50 ピクセルから 10,000 ピクセル x 10,000 ピクセルの間である必要があります。
- パスワード ロック: PDF がパスワードでロックされている場合は、送信前にロックを解除する必要があります。
- テキストの高さ: 抽出するテキストの最小の高さは、1024 x 768 ピクセルの画像の場合で 12 ピクセルです。 この寸法は、150 DPI で約 8 ポイントのテキストに相当します。
- カスタム モデル トレーニング: トレーニング データの最大ページ数は、カスタム テンプレート モデルの場合は 500、カスタム ニューラル モデルの場合は 50,000 です。
- カスタム抽出モデル トレーニング: トレーニング データの合計サイズは、テンプレート モデルの場合は 50 MB、ニューラル モデルの場合は 1 GB です。
- カスタム分類モデル トレーニング: トレーニング データの合計サイズは 1 GB で、最大 10,000 ページです。 2024-11-30 (GA) の場合、トレーニング データの合計サイズは 2 GB で、最大 10,000 ページです。
- Office ファイルの種類 (DOCX、XLSX、PPTX): 文字列の最大長の制限は 800 万文字です。
住宅ローン ドキュメントのデータ抽出を試す
住宅ローン ドキュメント サービスのデータ抽出のしくみを確認するには、次のリソースが必要です。
Azure サブスクリプション - 無料で作成できます。
Azure portal の Document Intelligence インスタンス。 Free 価格レベル (
F0) を利用して、サービスを試用できます。 リソースがデプロイされたら、[リソースに移動] を選択してキーとエンドポイントを取得します。
ドキュメント インテリジェンス スタジオ
Document Intelligence Studio ホーム ページで、[住宅ローン] を選択します。
サンプルの住宅ローン ドキュメントを分析したり、自身のファイルをアップロードしたりできます。
[Run analysis] (解析の実行) ボタンを選択し、必要に応じて [Analyze options] (解析オプション) を構成します。
サポートされている言語とロケール
以下の参照、サポートされている言語の完全なリストについては、 語サポート—の事前構築済みモデル ページをご覧ください。
フィールドの抽出
サポートされているドキュメント抽出フィールドについては、GitHub サンプル リポジトリの住宅ローン ドキュメント モデル スキーマに関するページを "参照してください"。
次のステップ
Document Intelligence Studio を使用して独自のフォームとドキュメントの処理を試す。
Document Intelligence クイックスタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始する。