ActiBookアプリアイコンActiBookアプリをダウンロード(無償)

  • Available on the Appstore
  • Available on the Google play

概要

TET5

決定することができない場合があります。このような状況では、処理時間を長くかけることにより、抽出されるテキストを改善することが可能です。これはstructureanalysis・layoutanalysisページオプションで制御できます。例:structureanalysis={list=true bullets={{fontname=ZapfDingbats}}}layoutanalysis = {layoutrowhint={full separation=preservecolumns}}layoutdetect=2layouteffort=high表組検出TETは、ページ上の表構造を検出して、表組の内容を表行・列・セルに構造化します。表組に関してページ上で検出された情報はAPIによって直接提供されることはなく、下記の例のようにTETML出力内でのみ利用可能となります:

TETprocessesall...
TETはオプショナルに、表組レイアウトを向上させるためにしばしば用いられる縦横の罫線や色付きのボックスを分析することもできます。このベクトルグラフィック分析はデフォルトでは無効化されています。これは、そのような図形要素がある場合には表組・レイアウト検出の結果を向上させえます。ベクトルグラフィック分析を有効化するには、たとえば下記のように、ページオプションvectoranalysisを用います:vectoranalysis={structures=tables}96 6章:テキスト抽出