Pythonで文書処理 : 資料のPDF化、文字認識、検索、その他さまざまな作業をプログラミングで解決

Bibliographic Information

Pythonで文書処理 : 資料のPDF化、文字認識、検索、その他さまざまな作業をプログラミングで解決

北山洋幸著

カットシステム, 2021.10

Other Title

Pythonで文書処理 : 資料のPDF化文字認識検索その他さまざまな作業をプログラミングで解決

Title Transcription

Python デ ブンショ ショリ : シリョウ ノ PDFカ モジ ニンシキ ケンサク ソノタ サマザマ ナ サギョウ オ プログラミング デ カイケツ

Available at  / 44 libraries

Note

参考文献(Webサイト): pv

サンプルファイルダウンロードあり

Description and Table of Contents

Table of Contents

  • 開発環境の準備(Anaconda編)
  • 開発環境の準備(Visual Studio Code編)
  • OCR環境の構築
  • PDFを画像へ変換
  • 画像をPDFへ変換
  • PDFの文字認識
  • PDFの保護解除
  • 透かし
  • PDFのサイズ変更
  • 画像の部分文字認識
  • 透視投影
  • 画像加工と文字認識
  • 画像のつなぎ合わせとPDF化
  • 文字列の検索(grep)
  • PyMuPDFの利用
  • PyPDF2の利用

by "BOOK database"

Details

Page Top