抄録
本研究は,減色処理と2値化処理を用いて,雑誌の表紙のような複雑な背景を持つカラー文書画像から文字情報を抽出することを目的とする.減色処理ではOngらによって提案された階層的SOMを改良した手法を基に,複雑な文書画像に適した前処理としてエッジ保存平滑化と局所フラクタル次元を用いるサブサンプリングを導入する.2値化処理では減色処理によって得られた画像を文字色と背景色の2色に分離し,文字抽出を行う.本研究では,Ground Truthを用いる評価法によって本手法と他手法を比較することにより,提案手法の有効性を検証する.
The purpose of this research is to extract the characters from color document images with complex background such as journal covers by using color reduction and binarization. We proposed an improved algorithm of color reduction based on the modified version of the Ong's SOM that incorporate the edge-preserving smoothing as preprocessing and the sub-sampling using local fractal dimension. We also propose an algorithm of binarization that enables the character extraction by separating the color of character from the color of background after color reduction. We perform the comparative experiments of the proposed method in comparison with the other methods using the evaluation with ground truth to demonstrate the effectiveness of the proposed method.