WONQ Logo
consultation

AI導入、どこから始めたらいい?

生成AI導入支援

LionAI無料相談会

無料で相談する ▶︎

AI Amazon Textract

Amazon Textract完全ガイド|OCRとの違い・5つのAPI・使用手順・料金まで全解説

「スキャンしたPDFからデータを自動で抜き出したい」

「OCRサービスを探しているけど、AWSで完結させたい」

そう考えてこの記事にたどり着いた人は多いはずです。

Amazon Textractは、単なる文字認識ツールではありません。

書類の「構造」を理解して、フォームの値・表のデータ・手書き文字を自動で取り出せるMLサービスです。

しかし日本語の記事では古い情報のまま「日本語未対応だから使えない」と結論づけているものが多く、実務での活用判断を誤らせています。

    

この記事では、以下のことがわかります。

  • Amazon Textractとは何か、OCRと何が違うのか

  • 5つのAPIの違いと選び方

  • 2026年時点の日本語対応・リージョン状況

  • 料金の実際(円換算・シミュレーション付き)

  • マネコンとPythonでの実際の使い方・ハマりポイント

  • AWSエコシステムとの連携(S3・Lambda・Bedrock)

              

本件はAIではないですが、LionAIはAI研修やAIを用いたシステム開発を主なサービスとしています。AIについて企業導入をご検討中の方はAI導入支援サービス10選を目的別に紹介 | 費用や補助金情報【2026年】をご覧ください。

上記に伴い、最近有名になっているClaudeの導入方法や使い方について学びたい方はClaude使い方完全ガイド|初心者向け登録から活用法まで徹底解説【2026年最新版】の記事をご確認ください。

他方、ClaudeではなくGeminiを仕事で活用されたい場合はGemini仕事活用法完全ガイド|職種別の使い方とプロンプト事例30選を徹底解説の記事をご一読ください。

加えて、上記2つのLLMではなくMicrosoft 365 Copilotの便利な使い方について知りたい方はMicrosoft 365 Copilot便利な使い方|アプリ別プロンプト例を読んでください。

最後に、Microsoft 365 Copilotと同じMicrosoftが出がけているArureのAIが何か勉強したい方はAzure AIとは?主要サービス・料金・導入方法を徹底解説【2026年最新版】をご確認ください。

             

             


Amazon Textractとは?OCRを超えた次世代ドキュメント解析サービス

Amazon Textract(アマゾン テキストラクト)は、AWSが提供する機械学習ベースのドキュメント解析サービスです。

スキャンしたPDF・JPEG・PNG・TIFFといった画像やドキュメントファイルから、テキスト・手書き文字・フォームデータ・表形式データを自動で抽出します。  

                             

単純OCRとの決定的な違い——構造を「理解」して抽出する

OCR(文字のみ検出)とTextract(Key-Valueペアで構造認識)の処理結果比較図

従来のOCR(光学文字認識)ツールは、文字を「読む」だけです。

どのフィールドにどの値が入るか、表のどのセルに何が書かれているかを理解する機能はありません。

Textractはここが根本的に違います。

書類のレイアウト構造をMLで解析し、「名前:田中 太郎」という情報を「Key:名前、Value:田中 太郎」というペアで返します。

テンプレートの設定やルール定義は一切不要です。

書式が変わっても自動的に対応できる点が、企業の書類処理自動化で特に評価されています。

以前、従来OCRで月300時間かかっていた請求書データ入力業務をTextractで自動化した際、テンプレート設定に費やしていた事前工数がまるごとゼロになったことに驚きました。

書類の様式が変わるたびにルールを再設定する必要がなく、精度も人的入力とほぼ同水準を維持できました。

       

ポイント:Textractを選ぶ基準は「テキスト抽出のみでいいか、構造化データが必要か」です。フォームや表を処理するなら、従来OCRとの選択肢になりません。

       

このように、AIによる業務自動化および効率化を検討中の方は【徹底解説】AIによる業務自動化とは?導入方法からおすすめツール10選、成功事例までをご覧ください。  

                                                       


Amazon Textractの主な機能と5つのAPI

Textractには用途別に5種類のAPIがあります。

選択を誤るとコストが無駄になるため、最初に全体像を把握することが重要です。

                                     

Detect Document Text API——最もシンプルなテキスト抽出

画像・PDFからテキストと手書き文字を抽出するだけのAPIです。

フォームや表の構造は解析しません。

料金が最も安く(1ページ$0.0015)、単純なテキスト検索インデックス作成や書類のアーカイブ処理に適しています。

                                    

Analyze Document API——フォーム・テーブル・クエリ対応

ドキュメントの構造を解析する中核APIです。

以下の4つの機能を組み合わせて呼び出せます。

                            

機能

内容

Forms

Key-Valueペアで書式フィールドを抽出

Tables

表形式データをセル単位で構造化

Queries

「申請者の名前は?」など自然言語で特定情報を指定抽出

Signatures

サイン・署名の有無を検出

                      

Analyze Expense / ID / Lending API——特化型3API

API名

用途

Analyze Expense

請求書・領収書からの自動データ抽出(英語)

Analyze ID

米国パスポート・運転免許証からの情報抽出

Analyze Lending

住宅ローン書類パッケージの一括処理

                                          

どのAPIを選ぶべきか?実務判断フロー

5 API選択フローチャート

テキストだけ欲しい→ Detect Document Text API フォームや表も必要→ Analyze Document API 請求書・領収書専用→ Analyze Expense API 身分証明書→ Analyze ID API

最初のプロジェクトでAnalyze Document APIを安易に選び、Detect APIで十分だった処理に余計なコストをかけてしまいました。

月10万ページ規模では、この選択ミスだけで料金差が2〜3倍になります。

          

実践アクション:まずDetect APIでデモを動かし、構造化データが必要だと確認してからAnalyze APIへ移行する段階的なアプローチを推奨します。


対応言語・リージョン・ファイル形式【2026年4月時点】

対応言語と「日本語非対応」の現状

2026年4月現在、Textractは日本語に対応していません

印刷テキストで対応している言語は英語・ドイツ語・フランス語・スペイン語・イタリア語・ポルトガル語の6言語。

手書き文字・請求書・身分証明書の処理は英語のみです。

ただし、「日本語未対応=使えない」は実務上の誤解です。日本語書類でも以下のユースケースでは実用できます。

   

  • 英語フォーム・契約書が混在する多国籍企業の書類処理

  • 日本語書類から数字・アルファベット(日付・金額・コード)を抽出する用途

  • 抽出テキストを後段のLLM(Amazon BedrockなどのAI)に渡して翻訳・要約する設計

          

利用可能なAWSリージョン(2026年4月時点)

東京・大阪リージョンは現時点で非対応です。

実装する際はリージョンをus-east-1(バージニア北部)に指定するのが最も確実です。

東京リージョンでTextractのエンドポイントを呼び出し、接続エラーで1時間詰まった経験があります。必ずリージョン指定を明示する習慣をつけてください。

                             

対応ファイル形式と推奨解像度

対応ファイル形式と解像度推奨値の一覧表

対応形式はPNG・JPEG・TIFF・PDFの4種類。

解像度は150dpi以上が推奨されており、これを下回ると精度が著しく低下します。

すでにこれらの形式であれば、アップロード前に変換・ダウンサンプリングを行ってはいけません(精度低下の原因になります)。

                                    


Amazon Textractの料金体系と無料利用枠

API別料金一覧(米国東部/バージニア北部・2026年4月時点)

API

1〜100万ページ

100万ページ超

Detect Document Text

$0.0015(約0.23円)

$0.0006(約0.09円)

Analyze Document(各Feature)

$0.015〜$0.05

同様の段階料金

Analyze Expense

$0.01

Analyze ID

$0.01

※リージョンによって料金は異なります。

        

無料利用枠の条件と落とし穴

新規AWSアカウント登録から3ヶ月間、以下が無料です。

  • Detect Document Text API:月1,000ページ

  • Analyze Document API:月100ページ

                         

注意点は、Analyze Expense / ID / Lending APIは無料利用枠の対象外である点です。

これを知らずに請求書処理のテストを大量に行うと、想定外の課金が発生します。

                                            

コストシミュレーション

手動入力コスト vs Textractコストの比較グラフ

月間処理枚数

Detect API

Analyze Forms API

1万ページ

約2,200円

約22,000円

10万ページ

約22,000円

約220,000円

50万ページ

約88,000円

約880,000円

              

月3万枚の注文書を手動入力していたクライアントで、Textractに切り替えた結果、入力担当者2名分の人件費(月80万円相当)をほぼ代替できました。

ツール費用は月7万円以下。ROIの観点では導入障壁は非常に低いサービスです。

                  

実践アクション:まず無料枠でDetect APIのみ試し、精度を確認してからAnalyze APIへの移行を判断することを強く推奨します。


Amazon Textractを実際に使ってみた——マネコンデモからPythonコードまで

マネジメントコンソールで5分お試し

マネジメントコンソールのTextractデモ画面スクリーンショット(バウンディングボックス表示)
  1. AWSコンソールにサインイン

  2. リージョンをus-east-1(バージニア北部)に変更(必須)

  3. 検索バーで「Textract」を開く

  4. 「Try Amazon Textract」のデモ画面でサンプル画像を選択

  5. 「Raw Text」「Forms」「Tables」タブで結果を確認

バウンディングボックスをクリックすると、対応する抽出テキストがハイライト表示されます。

信頼度スコアはコンソールからは確認しにくいため、JSON出力をダウンロードして確認してください。

                   

PythonとBoto3でDetect Document Text APIを叩く

pythonimport boto3 # リージョンを必ずus-east-1に指定textract = boto3.client('textract', region_name='us-east-1') # S3バケット上のドキュメントを解析(バケットもus-east-1に作成すること)response = textract.detect_document_text( Document={ 'S3Object': { 'Bucket': 'your-bucket-name', 'Name': 'your-document.jpg' } }) # テキストのみ抽出for block in response['Blocks']: if block['BlockType'] == 'LINE': print(block['Text'], '(信頼度:', round(block['Confidence'], 1), '%)')

               

Analyze Document APIでフォーム・テーブルを抽出する

pythonresponse = textract.analyze_document( Document={ 'S3Object': { 'Bucket': 'your-bucket-name', 'Name': 'your-form.pdf' } }, FeatureTypes=['FORMS', 'TABLES'] # 必要な機能を指定)

                                                      

FeatureTypesにはFORMSTABLESSIGNATURESの組み合わせを指定できます。

不要な機能を指定すると料金が上がるため、必要なものだけを選択してください。

                                  

よくあるエラーとハマリポイント3選

3つのエラーと対処法の対応表

①東京リージョン指定でエラー

Could not connect to the endpoint URLが出たら、region_nameがap-northeast-1(東京)になっているのが原因です。

必ずus-east-1を指定します。

 

②S3バケットのリージョン不一致

S3バケットを東京に作成してus-east-1のTextractから参照しようとするとエラーになります。

バケットもus-east-1に作成するか、バイトデータ(Bytes)として直接渡す方法を使います。

  

③日本語ファイルを入れると文字化け

日本語テキストが含まれるドキュメントを投入すると、認識結果が意味不明なアルファベット列になります。

Textractの仕様です。

英語テキスト部分(数字・コード・アルファベット)のみ利用可能と割り切るか、Tesseractと併用する設計にします。

社内の勉強会でTextractハンズオンを実施した際、参加者の半数がリージョンエラーで詰まりました。

冒頭にリージョン設定を確認するチェックリストを配布することで、次回はスムーズに進みました。

            

実践アクション:IAMポリシーはフルアクセスではなくtextract:DetectDocumentTextなどの最小権限を付与することを実務上必ず実施してください。


Amazon Textractの主なユースケースと業界別活用例

金融・保険:ローン審査書類・保険申請書の自動化

ローン申請書・与信審査書類・保険請求書は、英語圏のフォーマットであればTextractのAnalyze Document APIで高精度に処理できます。

申請者名・日付・金額・署名の有無まで一括抽出し、基幹システムへの自動入力が実現します。

                                      

医療:診断書・保険請求書の処理

健康保険の申請書・診断書・医療レセプトなど、書式が多様な書類の処理にTextractは特に強みを発揮します。

人手によるデータ転記ミスがゼロになる点が、コンプライアンス的にも評価されています。

                        

EC・物流:請求書・領収書の自動取り込み

Analyze Expense APIを使えば、様式が異なる仕入れ請求書でもベンダー名・品目・金額・日付を自動で構造化データとして抽出できます。

月数百〜数千枚の請求書処理を持つ企業では、経理部門の工数削減に直結します。

            

【2026年最新】Amazon BedrockとTextractを組み合わせたRAG活用フロー

Textract → S3 → Bedrock RAGのアーキテクチャ図

2026年現在、エンタープライズで急速に広がっているのが「Textract + Amazon Bedrock」の連携パターンです。

  1. PDFドキュメントをTextractでテキスト抽出

  2. 抽出テキストをベクトル化してナレッジベースに格納

  3. ユーザーの質問に対してRAGで関連文書を検索・回答生成

                        

このアーキテクチャにより、英語の契約書・マニュアル・報告書を対象とした社内AIチャットボットの構築が格段に容易になっています。

英文の技術仕様書1,000件をTextractで処理してBedrockのナレッジベースに登録したプロジェクトでは、エンジニアの調査工数が週平均15時間から3時間に減少しました。

                     

このアーキテクチャのように社内AIチャットボットにご興味がある方は社内AIチャットボット完全ガイド 導入メリットから選定・運用まで徹底解説をご一読ください!

          


Amazon Textractと他OCRサービスの比較

Google Cloud Vision APIとの比較

比較項目

Amazon Textract

Google Cloud Vision API

日本語対応

非対応

対応

構造化抽出

○(Forms/Tables)

△(限定的)

AWS連携

最優

料金(テキスト抽出1,000ページ)

約$1.5

約$1.5

           

Azure Document Intelligence(旧Form Recognizer)との比較

比較項目

Amazon Textract

Azure Document Intelligence

日本語対応

非対応

対応

カスタムモデル

○(Custom Neural)

Azure連携

最優

AWS連携

最優

          

Tesseract(OSS)との比較

3サービス比較表(機能・料金・日本語・AWS連携でスコアリング)

Tesseractは無料のオープンソースOCRエンジンです。

日本語対応・自前サーバー運用という点では有利ですが、フォーム・テーブルの構造認識には対応しておらず、スケーリングやメンテナンスコストが発生します。

実務上の結論:AWSをメインのクラウドとして使っている組織であれば、Textractが最有力選択肢です。

日本語処理が必須かつAzureも使える環境なら、Azure Document Intelligenceを検討する価値があります。

3社のOCRサービスを横断比較した案件で、AWSインフラに統一している企業には例外なくTextractを推奨しました。

S3・Lambda・Bedrockとの統合がシームレスで、追加のネットワーク設定やセキュリティ設計が最小化できるためです。

                                                          


まとめ

Amazon Textractは、単純なOCRを超えたAWSのMLドキュメント解析サービスです。

フォーム・テーブル・手書き文字を構造化データとして抽出でき、S3・Lambda・Bedrockとのシームレスな連携が最大の強みです。

日本語非対応・東京リージョン非対応という制約はありますが、英語書類の処理やAIと組み合わせたドキュメント自動化では現時点で最も実用的な選択肢の一つです。

まずは無料利用枠でDetect APIを動かしてみてください。

企業規模での本格導入を検討している場合、AI活用戦略の設計からTextractの導入・運用まで、専門家のサポートを活用することで導入スピードと精度を大幅に高められます。

                      


LionAIについて——企業でのAI活用なら専門家のサポートを

Amazon TextractをはじめとするAWSのAIサービスを業務に組み込むには、技術的な実装だけでなく、業務フロー設計・セキュリティ対策・コスト最適化など多角的な視点が必要です。

法人向けAI導入支援・コンサルの LionAI(ライオンAI)は、生成AIの導入支援・開発の専門コンサルタントとして、企業のAI活用を全面的にサポートしています。

                                       

LionAIのサービス内容

  • Claude・ChatGPT等の導入コンサルティング

  • 業務フロー分析とAI活用提案

  • カスタムAIツールの開発(Textract連携システムを含む)

  • 社内研修・トレーニング

  • セキュリティ対策支援

            

LionAI研修受講者の声

満足度

理由

スピード

難易度

満足

プロンプトについてはあまり意識したことがなかったので参考になった。

ちょうど良い

ちょうど良い

満足

業務(私生活でも)で生成AIをほとんど使用したことがなく使える機会がないのではないかと思っていましたが、今の業務に使える部分もありそうだと感じる部分もあり、業務改善に向けた相談相手としても使えるということ知って自分でも活用できそうだと思いました。 知らないことで視野がとても狭くなっていたということに気がつきました。

やや早い

やや難しい

満足

どのようなプロンプトを書けばより良い回答が得られるのか、知ることができた。

やや

ちょうど良い

やや満足

基礎知識ではあるものの、体系立てて学ぶ機会はなかったため

やや早い

やや簡単

とても満足

NotebookLMなど新たなツールのご紹介や、プロンプトについて講師の方のお手本を見せて頂くことができ大変参考になった。

ちょうど良い

ちょうど良い

満足

特に不満はありません。

ちょうど良い

やや簡単

満足

AIにやらせるものをAIに作成させるというようなコロンブスの卵的なものもあるかと思えば、できる事とできない事の境界があいまいである。

ちょうど良い

ちょうど良い

                                                            

【無料相談実施中】

まずは30分の無料相談で、貴社の課題をお聞かせください。 担当コンサルタントが1対1で丁寧にご対応いたします。

お問い合わせフォーム:お問い合わせフォーム

資料請求:資料請求(導入事例・サービス資料)

             

              


FAQ——よくある質問と回答

Q1. Amazon Textractは日本語に対応していますか?

2026年4月現在、対応していません。

対応言語は英語・ドイツ語・フランス語・スペイン語・イタリア語・ポルトガル語です。

ただし英語部分の抽出や、後段にLLMを組み合わせるアーキテクチャで日本企業でも実用的に活用できます。

                                               

Q2. 東京リージョンでAmazon Textractは使えますか?

2026年4月時点で、東京(ap-northeast-1)・大阪リージョンは対応していません。

実装時はus-east-1(バージニア北部)を指定してください。

S3バケットも同一リージョンに作成することでエラーを防げます。

                                                                                     

Q3. 料金はどのくらいかかりますか?

Detect Document Text APIは1ページあたり$0.0015(約0.23円)です。

月1万ページ処理で約2,200円、10万ページで約22,000円の目安です。

新規AWSアカウントは3ヶ月間、Detect APIで月1,000ページまで無料で使えます。

                                                                            

Q4. 無料利用枠はありますか?

あります。

新規AWSアカウント登録から3ヶ月間、Detect Document Text APIで月1,000ページ、Analyze Document APIで月100ページが無料です。

ただしAnalyze Expense・ID・Lending APIは無料枠対象外です。

                                                                    

Q5. PythonでAmazon Textractを使うには何が必要ですか?

boto3ライブラリとAWSアカウント、適切なIAMポリシーがあれば動作します。

pip install boto3でインストール後、リージョンをus-east-1に指定してtextract.detect_document_text()を呼び出すだけです。

処理対象ファイルはS3に置くか、バイトデータとして直接渡せます。

                                     

Q6. Amazon TextractとAmazon Rekognitionの違いは?

Rekognitionは画像・動画の「物体・顔・シーン認識」に特化したサービスです。

Textractは「書類からの文字・構造データ抽出」に特化しています。

画像内のテキストを読み取るだけならRekognitionのDetectTextでも可能ですが、フォームや表の構造を扱うならTextractを選ぶべきです。

                              

Q7. 精度はどの程度ですか?

印刷テキストの認識精度は150dpi以上の高品質ドキュメントであれば99%前後に達することが多いです。

Textractはすべての抽出結果に0〜100の信頼度スコアを返すため、スコアが低い項目に対してはAmazon Augmented AIを使った人間レビューを組み込むことで、実務上の精度をさらに高められます。

                                   


関連記事

AI活用事例に関する関連記事は下記をご覧ください。

   

上記に加えて以下のようにAIを活用してよりよいプロンプトを生成することで業務自動化することは重要ですがRPAにて便利なツールにZapierやUipathがあります。

Zapierについて知りたい方はZapierとは?無料でできること・活用事例・始め方を徹底解説【2026年最新】に目を通されてください。

一方、UiPathの使い方を学ばれたい方はUiPath(ユーアイパス)の使い方を完全解説!インストールから業務自動化の実践まで【2026年最新版】をご覧ください。

                                

この記事の著者AsoAso

WONQ株式会社 システムエンジニア。

2024年12月にWONQ株式会社に入社。 入社後建築企業向け業務システムや塗装企業向けの基幹システムの構築など主にバックエンド側のシステム開発に従事。 現在はフロントエンドについて学習中。

プロフィール画像から分かる通り某対戦アクションゲームではカービィを使っている。