PDF漫画のテキスト化、自分も2年前まで手動でやってました。今は3秒です。

漫画のセリフを手で打ち込んでテキスト化する。
実は、これ間違いです。
自分も最初、Word開いて1ページ20分かけて打ってました。
でも、AIに任せれば3秒で終わると知ってから、全てが変わりました。
今日は、漫画の吹き出しテキスト抽出について、自分が実際に2年かけて検証してきたツールを、失敗談込みで全部話します。
「漫画OCRなんて精度低いっしょ」って思ってませんか
漫画のテキスト化について、こんな声をよく聞きます。
「縦書きとか絶対ムリでしょ」
「擬音とか手書き文字、AIには読めないって」
「結局、手で打ち直したほうが早い」
自分も2年前まで全く同じこと思ってました。
実際、自分の自炊PDFを200冊くらいテキスト化しようとして、最初の1冊で30時間溶かしたことがあるんです。
180ページを1ページ平均10分。
途中で目が死にました。
しかも、テキスト化して何がやりたかったかというと、過去作の名台詞だけ抜いてSNS投稿したかっただけ。
「これ、やる意味ある…?」
3冊目で完全に心折れて、フォルダごと放置しました。
でも、転機があったんです。
漫画をテキスト化する革命
それが2025年。
Gemini 2.5 Proが、漫画の縦書き吹き出しを精度98%で読めるようになった瞬間でした。
最初に試したとき、マジで震えました。
自炊PDFをページ単位の画像に変換して、Google AI Studio に1枚アップ。
「このページのセリフを全部、JSON形式で抜き出して」
3秒。
完璧なJSONが返ってきました。
しかも、コマの読み順(右上→左下)まで正確。
擬音(ドーン!とか)と、ナレーション(〜という訳だった)と、セリフを、ちゃんと3種類に分類して返してくれます。
「は?」って声出ました。
しかも、自分が3冊目で挫折してたあの自炊PDF、試しに3ページだけ投げてみたんです。
結果、1ページあたりの所要時間:約3秒。
精度は98%。
たまに「ぁ」と「あ」を間違える程度で、人間の目で見てもどっちかわからないレベル。
そこから本気でバッチ処理スクリプト組んで、1冊180ページを並列処理させたら、8分で終わりました。
30時間→8分。
時給換算で考えると、自分が手で打ってた時間、1冊あたり3万円分くらい無駄にしてたわけです。
これ知らない人、マジで損してます。
漫画テキスト化のワークフローを整理すると、7工程ありますが、Gemini 2.5 Pro なら③〜⑥(吹き出し検出〜後処理)を1プロンプトで全部やってくれるのが革命的です。
「ツール選び」と「プロンプト設計」、この2つさえ押さえれば、誰でも今日から30時間の作業を8分に圧縮できます。
しかも、これって「漫画オタクの趣味」の話じゃないんです。
抽出したテキストを翻訳して海外配信したり、過去作のセリフをデータ化してSNSに名言クリップ投稿したり、自分の作風で書いたセリフをAI学習データにして「自分専用のセリフ生成AI」を作ったり。
要は、漫画というコンテンツを「データ」として再活用する起点になるのが、このテキスト化作業なんです。
2026年の今、ここを押さえてないクリエイターは、正直、機会損失してます。
逆に言うと、このテキスト化データを握ってるだけで、同じコンテンツを3倍・5倍に膨らませて収益化できるということ。
自分の意識を「作って公開して終わり」から「データ化して何倍にも活かす」に切り替えるトリガーが、この作業にはあります。
全部試した結果。使えるツール5つを正直レビュー
自分はこの2年で、漫画テキスト化に使えそうなツールを片っ端から試しました。
正直、ほとんどはゴミでした。
とりあえず、できるという点では、合計5個。
精度と手軽さで分布させたのが上のマップです。
1個ずつ、自分の実体験ベースで話します。
① Gemini(Google AI Studio)

Google AI Studio で誰でも触れる、Googleの最新マルチモーダルモデル。
無料枠だけで、漫画1巻まるごとテキスト化できます。
おっ、と思った点。
縦書き、横書き、擬音、手書き、全部ワンショットで読みます。
しかも指示通りのJSONで返すので、後処理が一切いりません。
API経由なら1ページあたり0.5円くらい。
180ページの単行本を1冊90円で全文テキスト化できる計算です。
これ知ってるか知らないかで、年間の作業時間が100時間単位で変わります。
弱点は2つだけ。
たまにコマの読み順を間違えるのと、擬音を勝手に「読みやすく」修正してくることがあります。
しかしアダルト、エロ系、微エロは無理です。
それとチャット形式なので面倒臭いしその間は時間を奪われます。チャットで1枚ずつやり取りするなら読んだ方が早いケースが多いです。
② manga-ocr(OSS・漫画特化)— 大量処理ならこれ

kha-white/manga-ocr は漫画専用に作られたPython製のOSS。
GitHub Star 2,600個ついてます。
これ、Apple Siliconに最適化されてて、ローカルで爆速処理できるんです。
自分のパソコンで試したら、1ページ0.3秒でテキスト化終わりました。
しかも完全無料、商用利用OK、API代ゼロ。
manga-ocr "your-comic.zip" --verbose
Zip圧縮した漫画フォルダをそのまま投げるだけで、全ページのテキストがJSONで吐き出されます。
ぶっちゃけ、月100巻以上テキスト化するなら、Geminiより安くて速いです。
ただ、多くの漫画で話になりませんでした。条件に適した作品なら抜けます。
あくまで「漫画専用」と割り切って使うのが正解です。
自分のおすすめの組み合わせは、Geminiでプロンプト調整 → manga-ocrで量産のハイブリッド。
初期チューニングはGeminiの賢さに頼って、量産フェーズではmanga-ocrでコスト削る。
ただ問題は、manga-ocrは抜ける作品は、バラツキがあります。
③ Mokuro — ブラウザでセリフを選択コピーできる魔法

kha-white/mokuro は、manga-ocrの作者が作ったWebビューア向けOCR。
何がヤバイかというと、OCR結果を漫画画像にオーバーレイして、ブラウザでセリフを選択コピーできるんです。
漫画を漫画のまま読みながら、気になったセリフだけドラッグしてコピペできる。
日本語学習者向けには最強ツールです。
自分は海外向けの漫画レビューサイトを作るときに、これを使ってます。
セリフを選択コピーできるって、地味ですが死ぬほど便利です。
スクショ撮って、画像編集ソフトで切り抜いて、別のOCRに投げて…って手順が全部いらなくなるので。
④ Google Cloud Vision API — 縦書き正答率ほぼ100%

老舗の本気。
Google Cloud Vision API は、月1000枚まで無料で使えて、縦書き日本語の正答率がほぼ100%です。
ただ、APIキー発行とかGCPの初期設定が地味にだるい。
技術的なハードルが少しあるので、プログラミング書ける人専用って感じです。
漫画特化ではないので、吹き出しの読み順とかは自分でロジック組む必要があります。
⑤ 文字起こしさん — スマホで秒で終わる

文字起こしさん は、登録不要で1日20回まで無料。
スマホでパシャッと撮ってアップするだけで、AIが勝手にテキスト化してくれます。
「とりあえず1ページだけ試したい」って人には、これが一番手軽です。
ただ、量産には向きません。
100ページ超えるなら、素直にGeminiかmanga-ocrにいきましょう。
でも、これらの基準は、「使える」じゃなくて「可能か非か。」です。
なぜ漫画の文字お越しをやるのか?大部分の人の本質
ここから大事な事は、
「漫画の文字お越しはなぜやるのか」
です。
正直言うと読む方が早いケースもあります。
目で見ながらテキストを打つ方が作品の長さによるけど早いです。
何のために漫画をテキスト化するのか?が肝になるのですが…自分の場合は、
「作品を分解して再構築するため」です。
どこで何が切り替わって どこで面白さが出ているのか。
この骨組みを抽出して
異なるキャラ、異なるセリフ、異なる背景 で 再構築したい からです。
この使い方だと正直全部使えないです。
なぜならセリフだけでなくどこで何が起きたかを理解しないといけないからです。
実は、テキストだけ抜いても、今度はそのセリフを元に流れを言語化するのが大変な作業です。
読まないで分析するのが理想です。
漫画を完全にリライトする発想
そこで自分は、小説や漫画なども含めて
書籍の分析 そして再構築する仕組みを作ったんですね。
それが ANGLEXPROです。

このツールは少し用途が違います。
高度な画像生成機能でありアダルトもOKで、
「漫画を一切読まずに全体の流れを分析する」という芸でなく同時に自分の指定したキャラなどに置き換えて、ストーリーを構成する機能を初実装してます。
「読みたくないけど、構成を抜きたい」そう言う人にとっては、今回のANGLEXPROは最適です。

この機能をANGLEXPR を導入した経緯は、
「既にある作品の面白いポイント」つまり流れだけを分析して
オリジナルの音声やキャラで作る事です。
完全に違うものになるため、著作権にも一切触れません。
簡単に言ってしまうと、素人でもプロの書籍から「面白い要素」のみを抽出して
全自動で構築する流れです。

絵が書けなくても 実写からアニメにしたり元のキャラを変換していけば、



固定キャラでストーリーに適したシーンを簡単に作れます。
小説モードに関して言えば、文章は最後まで自動、画像生成はシーンによって枚数を指定すれば自動で生成されます。
固定キャラで。


プロンプトの指示さえ不要。
生成されたストーリーを元に、「勝手にAIが作る」というもので、キャラクター複数でもキャラ登録しておけば、
「誰のことか」を判別できるように組んでいるため画像生成に反映します。
またPOVモードにすれば、視点が主人公目線寄りで画像を生成する仕様です。
つまり官能小説、体験談+画像付きコンテンツは、一瞬で生成できます。
そして自分の作品としてどこにでも登録ができる、しかも縦書きにも対応し、海外向け変換も可能で、EPUB形式も、2種類、画像出力にも対応しています。
つまり横書きのブログ延長線上ではなく、「完全本物志向」のツールです。
特にキャラ固定でクリックのみでアングル変更も可能なため、書籍のあとは、CG集はクリックなど簡単な作業で意図も簡単に生成できます。
「漫画なんて想像できない。」
でも作れる。可能な限り面白いコンテンツ、つまり読む人の存在を前提にしていて、ハウツー本一つとってもWEBリサーチの深度を元に行えます。これはパープレキシティなどの有料APIを使わずコスパ良く運用できるスキームも導入済みです。
「作っても売れないんじゃないか」これで、書籍出版、漫画、小説で挫折した人でも、このツール1個で収益化を実現できます。
漫画にも使えるコマテンプレ。


画像をドラッグ。

当たり前ですが縦書きにも完全対応。

セリフ挿入も鬼簡単。

画像、コマ、セリフ全部いけますし、セリフに悩んだりストーリーに悩んでもアダルト、一般可能な専用AI機能があるため、文才ゼロでも作れます。
つまり書籍分析から自分の作品完成まで、全て 知識ゼロ経験ゼロでも可能な機能を実装し最短で構築できるのが今回のANGLEXPRO です。
よく稼げますか?という質問が届きます。
もはや、ここまで読んで無理と思う人は、辞めた方がいいですが、稼げない理由ってあるかが疑問です。
どこまで最安でも数百円のラインは現実的です。労力を考慮すれば、数百円ずつ積み上げて1冊の収益性が未来レベルで1000円越えるなら割に合う話に変わります。大事な事はコツコツ積み上げです。
ブログやサイトと比較しても初収益は早く、同時に単なるAIブログ記事生成ツールの延長線で生成したコンテンツとは、一線を越えた次元の仕組みです。

是非チャレンジしてみてください。




