這很重要
非英文翻譯僅供方便使用。 請參閱 EN-US 本文件的最終版本 以獲得最終版本。
本文提供光學字元辨識的使用案例相關信息(OCR)。
什麼是透明度注意事項?
AI 系統不僅包括技術,還包括將使用該技術的人員、將受其影響的人員,以及部署所在的環境。 建立適合其預期用途的系統,需要了解技術的運作方式、其功能和限制,以及如何達到最佳效能。
Microsoft提供 透明度注意事項 ,協助您瞭解 AI 技術的運作方式。 這包括系統擁有者可以進行、會影響系統效能和行為的選擇,以及考量整個系統的重要性,包括技術、人員和環境。 您可以在開發或部署自己的系統時使用透明度說明,或與將使用您的系統或受您的系統影響的人共用它們。
透明性報告是 Microsoft 在更大範圍努力的一部分,來實踐我們的 AI 原則。 若要深入瞭解,請參閱 Microsoft的 AI 原則。
光學字元辨識簡介 (OCR)
現今的企業經常需要將文字從影像、掃描的紙張檔和數位檔案轉換成可採取動作的深入解析。 這些洞察促進知識探索、業務流程自動化,並改善內容的可及性,適用於所有人。 光學字元辨識 (OCR) 是 AI 服務,可用來從影像和檔等視覺內容擷取文字。 OCR 目前支援數種語言來擷取列印文字(請參閱 OCR 支援的語言)。 手寫 OCR 目前僅支援英文版。
OCR 的基本概念
Microsoft 的 OCR 技術 透過 Azure Vision in Foundry Tools Read API 提供。 客戶可使用其內容呼叫讀取 API,在機器可讀取的文字輸出中取得已擷取的文字、其位置和其他深入解析。 他們會處理其商務應用程式內的資料,以為其使用者實作內容智慧、商務程序自動化和其他案例。
| 詞彙 | 定義 |
|---|---|
| 非同步的 | 異步表示服務不會立即傳回擷取的文字。 此時,會在背景中啟動程序。 客戶應用程式必須在稍後回來查看,才能取得擷取的文字。 |
| 參閱 | 讀取作業是異步呼叫,可接受影像和文件開始分析和文字擷取,而該呼叫會透過另一個呼叫傳回。 |
| 取得讀取結果 | 當分析和擷取程式處於使用中狀態時,取得讀取結果作業會輸出進度狀態。 當程式完成時,取得讀取結果作業會輸出擷取的文字(以文字行和文字的形式)和信賴值。 |
| 信心值 | [取得讀取結果] 作業會針對所有擷取的單字傳回介於 0 到 1 之間的信賴值。 此值代表服務每 100 次可正確擷取字組的估計次數。 例如,估計 82% 時間正確擷取的字組會產生信賴度值 0.82。 |
範例使用案例
下列使用案例是 OCR 技術的熱門範例。
- 影像和文件搜尋和封存:法律合約、技術檔和新聞內容等非結構化檔包含豐富的資訊和元數據,這些資訊與元數據不適用於自動化標記、分類和搜尋等程式。 OCR 可讓這些檔中的文字可供計算機讀取,以供分析、搜尋和擷取。
- 影像內容仲裁和當地語系化:電子商務公司、用戶產生的內容發行者和在線遊戲和社交媒體社群需要仲裁影像,才能符合在線安全法規。 在某些情況下,他們也需要將國際對象的內容當地語系化。 OCR 可讓您從影像擷取文字以套用下游處理。
- 商務程式自動化:商務程式自動化需要在文件和應用程式畫面中整合使用者輸入的數據和喜好設定,以及複雜的商務程式。 OCR 會解除鎖定內嵌在檔和影像中的文字,並使其可用於商務工作流程的步驟。
- 財務和醫療保健文件處理:當用於財務和保險申請窗體的後台處理時,OCR 有助於節省檔處理的時間和精力。 同樣地,將OCR應用於醫療索賠報銷和醫療資訊表格,可以加速經費報銷及確認服務和福利資格的流程。
選擇其他使用案例時的考量事項
當您選擇使用案例時,請考慮下列因素。
請仔細考慮在用於獎勵或拒絕權益時:如果根據不正確或不完整的資訊,直接使用 OCR 輸出來獎勵或拒絕權益可能會導致錯誤。 例如,填寫醫療表格時,使用者們可能會犯錯或未能包含重要資訊。 此外,OCR 可能會誤讀或無法偵測表單的某些部分。 為了確保消費者的公平和高品質決策,請將 OCR 型自動化與人為監督相結合。
避免使用簽章識別:當您擷取手寫文字時,請避免在簽章上使用 OCR 結果來識別個人。 對於人類和機器來說,簽章很難閱讀。 使用 OCR 的較佳方法是將其用來偵測簽章是否存在,以進行進一步分析。
請勿將 OCR 用於可能造成嚴重不利影響的決策:這類使用案例的範例包括處理醫療處方和配藥。 從處方中擷取文字的機器學習模型可能會導致無法偵測或不正確的文字輸出。 根據不正確的輸出做出決策,可能會產生嚴重負面影響。 此外,建議對可能對個人產生嚴重影響的決策進行人工審查。
-
法律與法規考量:組織在使用任何 Foundry 工具與解決方案時,需評估潛在的具體法律與監管義務,這些可能不適用於所有產業或情境。 此外,Foundry 工具或解決方案並非設計用於適用服務條款及相關行為準則中禁止的用途。