コージェントラボ、次世代AI OCR「SmartRead」に非定型文書に含まれる表の抽出機能を追加
最先端人工知能(AI)技術の開発・提供を行う株式会社Cogent Labs(本社:東京都港区、代表取締役社長:CEO エリック・秀幸・ホワイトウェイ、以下コージェントラボ)は、次世代AI OCR(※1)「SmartRead(スマートリード)」に、財務・監査法人向けのソリューションとして非定型(※2)文書に含まれる表の抽出機能を追加しました。これにより、決算書等に複数含まれる表の領域を選択するだけで表のデータ化が可能となるため、処理業務の大幅な効率化を実現します。
■開発背景
財務や監査法人において、複数の表を含んだ決算書等の複雑な文書のデータ化を行う作業に労力がかかっているという現状があります。
コージェントラボはこれまでも、請求書や注文書等の非定型文書(レイアウトが発行元により異なるが項目は共通している文書)を高い精度で識別し読み取れる機能を提供しており、対応文書および機能を拡張してきました。
今回はその一環として、非定型文書に含まれる表の抽出機能を開発しました。
■非定型文書に含まれる表の抽出機能について
【特長】
・抽出したい表の領域を選択するだけで丸ごとエクセルデータに変換
・独自の技術により罫線のない表も正しく抽出
・決算書などの複雑な構造の表を含んだ非定型文書を、事前に定義する必要なく、簡単に読み取り可能
【主な対象業界・企業】
財務、監査法人、BPOなど
コージェントラボは、今後も各業界・業務のDXを推進するため、お客様のご要望に合った「SmartRead」の機能を拡張予定です。
※1 AI OCR(人工知能による光学式文字認識):機械学習を活用した項目抽出や文字認識により、文書内に記載された文字情報をテキスト(データ)化する技術
※2:定型文書とは、レイアウトが規定された文書です。例えば、自社で形式が決まった申込書などです。一方、非定型文書とは、レイアウトがばらばらな文書です。お取引をする企業によって各社ごとに形式が異なる請求書などを指します。
■株式会社Cogent Labs(コージェントラボ)について
最先端のAI技術を用いた実用性の高いサービスの開発・提供を通して知的労働のDXを推進し、生産性向上や労働力不足等の社会課題の解決を目指す企業です。AIの認識・自然言語処理技術を生かしてドキュメント処理全体のDXを実現するプラットフォーム「Cogent DX」の構築を進めており、その一環として次世代AI OCR「SmartRead」を提供しています。
本社:〒106-0032 東京都港区六本木3-2-1 住友不動産六本木グランドタワー36F
設立:2014年4月
代表者:代表取締役社長CEO エリック・秀幸・ホワイトウェイ
資本金:4,801,580,048円(準備金含む)
URL:https://www.cogent.co.jp
本件に関する報道関係者からの問い合わせ先
株式会社 Cogent Labs
Tel:03-6773-1836
メール:[email protected]