世界最高水準の文字認識精度 手書き文書データ化サービス 新生AI OCR『Tegaki』を2019年7月30日より提供開始
株式会社Cogent Labs(代表取締役CEO:エリック・秀幸・ホワイトウェイ、以下コージェントラボ)は、2017年より数多くの企業に導入いただいているAI OCR『Tegaki』を改良し、世界最高水準(当社比13%向上)の手書き文字認識精度データ化サービス新生『Tegaki』として2019年7月30日より提供開始いたします。本サービスを通じてデータ入力作業の効率化とコスト削減、労働生産性の向上を実現し、2021年までに400件の新規導入を目指します。
近年、マイナンバー関連業務、ストレスチェック制度の導入、電力小売/ガス小売自由化などの制度改革に伴いドキュメントは増え続けており、国内ドキュメントアウトソーシングサービス市場の2015年~2020年の年間平均成長率は7.1%、2020年の市場規模は4,023億4,500万円と見込まれています。(※1)多くの企業では、人材不足や働き方改革といった要因から業務効率化ニーズが高まっており、AI OCR市場は多種多様な帳票を扱う企業に向けた新規導入を中心に拡大しています。
手書き文書データ化サービス『Tegaki』は、2017年8月より提供を開始し、これまで様々な業界業種のお客様にサービスを提供してまいりました。
そして今回、増え続けているドキュメント処理の需要に対応すべく、従来利用していたディープラーニング(深層学習)モデルを国内外の最新のAI研究をベースに一から見直し、大量のデータで再学習させ、全く新しいモデルを再構築しました。結果、世界最高水準の手書き文字認識精度を達成し、精度を飛躍的に向上させることに成功しました。(※2)
また、これまで自動認識による読み取りが難しいとされていた手書き文字を認識し、スピーディーかつ高精度でデータ化すると同時に、膨大な資料や文書を解析し、最新動向をつかむことで読み取り精度を継続的に向上させることが可能です。
従来の『Tegaki』と新生『Tegaki』を比較すると、一般的な申込書での読み取り精度が平均13%向上いたしました。
今後もコージェントラボは常に最新の研究をもとに『Tegaki』をアップデートし提供することで、業務の効率化と労働生産性を向上させ、AIで人々の生活の質を上げる未来を創ってまいります。
本件に関するエンドースメント
ソフトバンク株式会社 法人事業統括法人プロダクト&事業戦略本部副本部長 兼RPA事業推進室室長
上永吉聡志様
コージェントラボ様における、新生「Tegaki」の提供開始を心より歓迎いたします。およそ2年前、コージェントラボの「Tegaki」と出会い、日本発のグローバル・カンパニーである同社にイノベーターとしての可能性を感じました。当社は「Tegaki」の販売を昨年より開始しておりますが、識字率向上を目的とした共同プロジェクトでのサンプル帳票による学習とモデルアップデートを経て、飛躍的に識字率が上がったという実感があります。AI OCRで業務自動化のご提案を進める上で、手書き文字の認識精度は非常に重要です。従来よりも更に識字率が強化された「Tegaki」を当社のRPAソリューションと組み合わせることにより、 お客様へさらに価値あるサービスを提供できると確信しております。
株式会社みずほフィナンシャルグループ デジタルイノベーション部 デジタライゼーション推進チーム シニアデジタルストラテジスト / 株式会社Blue Lab シニアデータサイエンティスト 白河 龍弥様
コージェントラボ様の新生「Tegaki」の提供開始を心より歓迎いたします。
銀行の中では手書き帳票の取扱いを自動化するニーズが高まっており、「Tegaki」は銀行の中にある様々な手書き帳票の読取を支える重要な基盤となっています。
今後も一層、コージェントラボ様との連携を強化し、新しいビジネスサービスを実現して参りたいと考えております。
『Tegaki』製品概要
『Tegaki』とは、手書き書類をスキャンして取り込むだけで簡単にデータ化して保存ができる手書きOCRサービスです。これまで自動認識が難しかった手書き文字を高精度かつ素早く読み取ることができます。
『Tegaki』の4つの特徴
✓学習性 : 読み取り精度の継続的な向上:最新の研究をもとにディープラーニングを活用したアルゴリズムから構成され、データを処理しながら学習することで、読み取り精度が継続的に向上。
✓拡張性 : 他言語への対応:トレーニングデータを準備する事で各種他言語の手書き文字読み取りへの適用可能。業界用語への対応:言語モデルを備えており、業界特有の言語モデルと連携すれば読み取り精度を高めることが可能。
✓利便性 : プロセスの簡素化:活字・手書き文字双方に加え、チェックボックス・丸囲い文字などを一つのサービスで読み取れるため、フォーム毎OCRとの使い分けや選別をする手間が不要。
✓経済性:スタンダードプランにて、シングルライン10文字(ひらがな5文字、漢字5文字)の場合、人による入力は18.6円〜のところ、『Tegaki』では1円以下と、およそ95%のコスト削減を実現(※3)
(※1)国内ドキュメントアウトソーシングサービス市場 売上額予測、2015年~2020年(IDC Japan)
(※2)一般的な申込書の場合、当社比約13%の認識精度向上
(※3)日本データエントリー協会 2019年度データエントリー料金資料より
(https://www.jdea.gr.jp/index.html)
*OCRとは
Optical Character Recognition/Reader、オーシーアール、光学的文字認識。手書きや印刷された文字を、イメージスキャナやデジタルカメラによって読みとり、コンピュータが利用できるデジタルの文字コードに変換する技術
株式会社Cogent Labsについて
クラウドからエッジまで、最先端でありながら、実用的なAIのサービス開発を行う東京を本社とする企業。生産性の向上が課題である企業や熟練労働力の不足に直面している企業に、製品とサービスを提供する。世界20か国超から人材を採用し、従業員数は65名(2019年5 月末時点、契約社員および派遣社員含む)。手書き文字の読取りに高い識字率を誇るAI-OCRの「Tegaki」、自然言語を理解し非構造的な言語情報を言語依存せず構造化し解析できる「Kaidoku」や、時系列データをもとに将来を予測する「TSF」を実サービスとしての提供に加えて、カスタムAIコンサルティングおよび開発を行う。
本社:〒150-0034 東京都渋谷区代官山町20-23 TENOHA LAB
設立:2014年4月
代表者:代表取締役CEO エリック・秀幸・ホワイトウェイ
資本金:28億262万円(準備金含む)
事業内容:最先端の人工知能の研究・開発と関連ソリューションサービスの提供
URL:http://www.cogent.co.jp
本件に関する報道関係者からの問い合わせ先
株式会社 Cogent Labs
Tel:03-6773-1836
メール:[email protected]