※Position at time of interview
「日本でAIアノテーションのモメンタムを作る」アッペンジャパン新代表の決意
AIのビジネス活用が急速に進む中、それを技術面で裏側から支える企業がある。AIの機械学習に必要な教師データの「アノテーション」を世界中のテクノロジー、自動車、金融、小売、医療産業のリーダー企業、および各国の政府に提供するAppenだ。
1996年、オーストラリアで創業したAppenは、2021年7月に日本法人アッペンジャパンを設立。2023年10月から新代表を務める多賀太氏は、「アノテーション含めたAI学習は、AI開発の7割を占めるとても重要な工程」だと言う。同社が提供するアノテーションサービスの特徴と、新代表による日本展開の意気込みを聞いた。
「170カ国のネットワーク」「AI搭載型プラットフォーム」が強み
AI開発には、大量のデータを読み込ませる機械学習が必要だ。学習させるデータは「教師データ」と呼ばれ、画像やテキスト、音声などのデータにタグや注釈などのラベリングを行う。
例えば、人の顔を学習させたい場合は、1枚1枚の画像のどの部分が「顔」なのかを、AIに指示しなければならない。この一連のラベリング作業を「アノテーション」と呼ぶ。画像のみならず文章データや音声データも、アノテーションすることで初めてAI開発に使えるデータになる。
このアノテーションの質とスピードが、AI開発の成否を分けるのは言うまでもない。Appenは2つの特徴を強みに、スピーディーかつ精度の高い教師データを企業に提供している。その一つは「アノテーター」の存在だ。
「Appenの特徴の一つは、世界170カ国に100万人以上の高い専門性を持つリソース(アノテーターを含む)を有していることです。日本国内にも6万人ほどいます。中には翻訳家、医師、看護師など、言語や特定の分野に精通している方もいて、精度の高いアノテーションが可能です。対応できる言語は290以上あるため、自動翻訳ツールなど多言語のデータが必要なプロジェクトにも対応しています」
Appenのもう一つの特徴は、AIやディープラーニングの技術を活用し、アノテーションの効率化・自動化が可能な「データアノテーション・プラットフォーム」を提供していることだ。導入企業は、クラウド上でデータ収集からアノテーションまでを内製化できる。
「Appenのプラットフォームには、AIやディープラーニングが搭載されています。人の顔を認識させたい場合は、画像を取り込んだ瞬間に自動的にラフな加工が行われ、企業の担当者が微修正するだけで教師データが完成します。ディープラーニングによって、回数を重ねていくうちに自動加工の精度も上がります」
AppenはオンプレミスとSaaSの両方の形でサービスを提供している。データや作業する人が確保できない企業は、その部分をAppenに外注できるので「お客様の選択肢の幅が広い」と、多賀氏は言う。
そんなAppenの日本法人アッペンジャパンは、多賀氏を含む3名で構成されている。アッペンジャパンは主に、日本企業への営業、導入サポートを担当しており、アノテーションのデリバリー、およびアノテーターのマネジメントは中国支社「Appen China」が行う。
日本でAppenを使用し始めた企業は20社を超え、幅広い業界で使われていると言う。
「モノづくりの現場では、不良品の検知にAIが使われています。また、インフラ業界では、建物や橋桁、道路のコンクリートの劣化を自動走行ロボットがチェックしていますが、その際に使われる学習データを提供しています。最も需要が大きいのは人物認証です。商業施設などでマスクをしているかどうかを判断するなど、人の認証にまつわるソリューションを提供する企業でAppenの教師データは使われています」
日本法人設立から1年あまりで、年間売上数億円規模にまで伸長しているところを見ると、日本マーケットのポテンシャルの高さが伺える。
「日本のAIに遅れを感じていた」新代表就任の想い
多賀氏は2022年7月にアッペンジャパンに入社した。前職はSAPジャパンにて、自動車業界向けの営業を担当。その知見を生かして、アッペンジャパン入社後もセールスマネージャーとして活躍してきた。
2023年10月に新代表となった多賀氏。就任の理由を以下のように語る。
「もともと会社運営をやってみたいと思っていたんです。代表就任の打診は、思ったよりも早いタイミングで来ましたが嬉しかったですね。ずっと営業をやってきたので、経営や人・組織のマネジメントはほぼ初めて。身が引き締まる思いです」
今の意気込みについて、代表になるまでの約1年間の経験から「Appenをもっと知ってもらいたい」と語る。
「アッペンジャパンは、日本ではまだ知名度がほとんどありません。教師データやアノテーションという言葉もメジャーではない。まずは認知度を上げていきたいです」
日本のAI開発は海外に遅れを取っていると言われているが、その背景に「開発思想の違いがある」と多賀氏は指摘する。
「あくまでも私見ですが、AI開発が進んでいるアメリカや中国は『加点方式』で開発をしています。ミスや失敗が起きることを前提に、すばやく改善を回すようにしているんです。一方、日本はミスがなるべく起きないように『減点方式』で進めている。歩行ロボットの開発においても、アメリカや中国は『とにかく転ばないもの』を作り、日本は『まず、きちんと立ち上がるもの』を作る、という話を聞いたことがあります。そもそもの考え方や出発点の違いが、スピードの差を生んでいるのだと考えています」
こうした考え方の差はアノテーションの受け入れられ方にも表れているようだ。
「アノテーションにおいても、アメリカや中国はデータサプライヤーに外注するのが一般的です。その分、AIの企画、開発、ローンチにリソースを集中させます。一方、日本企業の多くではアノテーションを自社の従業員が行っています。使っているツールもオープンソースのものであり、機能や精度には限界があります」
Appenを日本で展開していくことは、日本のアノテーションに対する認識を広げ、ひいてはAI開発のスピードを速めることにつながる。
EGGで得られる「安心感」と「大手企業との接点」が事業を加速する
日本展開を進める上では、日本企業、特に大手企業との接点が必要だ。その点、「EGGに入居していることはメリットだ」と、多賀氏は言う。
「EGGに入居してから、大企業からの見え方が変わりました。丸の内というメジャーな立地に格式高いオフィスを構えているというだけで、先方は安心されるようです。設立間もないベンチャーだからこそ、顧客企業に安心感を与えることは非常に重要です」
また、EGGが運営するコミュニティ「TMIP(Tokyo Marunouchi Innovation Platform)」の存在も大きいと言う。TMIPとは、大企業とスタートアップ・官・学の連携によるイノベーション創出を支援するコミュニケーションプレイスだ。
「日本を代表する企業の新規事業開発チームがTMIPに所属されています。EGGを運営する三菱地所さんがそうした方々と我々を積極的につないでくれるんです。大企業の資本力やリソースを持つチームと共に、我々も社会貢献につながる活動に一緒に取り組んでいきたいと思います」
加えて、「Phone booth(フォンブース)や会議室など、設備が整っているので働きやすい。一つひとつの調度品も素敵です」と、多賀氏は語った。
品質向上とコスト低減でアノテーションプラットフォームの普及を狙う
東京・丸の内という場所から、日本展開の加速を狙うアッペンジャパン。今後の展望は、前述した「データアノテーション・プラットフォーム」の普及だ。そのためには、いくつか乗り越えるべき壁があると多賀氏は言う。
「日本にはまだ、大量の学習データを求めている企業が多くありません。少量のデータを扱うのならばオープンソースのツールでよく、弊社のプラットフォームを必要とされていない方も多い。また、お客様の中には、アノテーションの技術やノウハウがないため、ツールを導入しても使い方が分からないという方もいました」
アメリカや中国では、大量の学習データが必要なプロジェクトが多く存在する。かつ、企業が自社のAI開発や開発者の採用・育成に積極投資をしている。グローバルな基準に照らし合わせ、日本でもAIやアノテーションの「モメンタムを作りたい」と、多賀氏は意気込みを語る。
「日本企業のみなさんには、アノテーションを外注することで、優秀な開発者たちのリソースをモデル構築やサービス作りに集中させることを推奨しています。アノテーションの専門家である我々に任せていただくことで、日本企業のAI開発の精度や効率、サービスの質を高めていきたいです」
そのために、Appenは提供するアノテーションサービスをさらに強化していく。方針は「品質の向上」と「金銭的・時間的コストの低減」の2つだ。
「品質を高めるために、AIやディープラーニングの機能を強化していきます。また、アノテーターのみなさんに様々なプロジェクトを経験してもらうことで、専門性を高め、ケイパビリティーを広げていきたいと思います」
「企業側にかかる金銭的・時間的コストを削減していくには、アノテーターのみなさんから上がってきた納品データを、弊社側でチェックする工数を減らしていく必要があります。プロジェクトの難易度に合わせて、経験のあるアノテーターをマッチングし、納品データ自体の品質を高めていきます」
また、「そのチェックの手法も改善していきます。チェックする際は全てのデータを一つずつ見るのではなく、サンプリングしたデータをチェックすることで工数を抑えています。リスクがありそうな部分、例えば、経験の少ないアノテーターが作業した部分などをプロジェクトマネージャーが見極め、そこを集中的にチェックしているんです。それによって、最小工数で全体の精度を高めることができます。プロジェクトマネージャーの育成とともに、将来的には、AIによるサンプリングなども実現していきます」
現在3名体制のアッペンジャパンは、採用を加速し、2025年には10名体制を築こうとしている。「日本のAI活用が本格的に活性化するのは、2025年くらい」と多賀氏。現在はAppen Chinaが担当するアノテーターのマネジメントやデリバリーも、アッペンジャパンで内製化し、よりスピーディーなサービス提供を実現していく考えだ。
最後に、今後拡大していく体制を見据え、新代表としての組織作りの考えを教えてもらった。
「メンバーがより能力を発揮し、ストレスなく仕事を行うためのサポートをするのが代表の役割だと思います。アッペンジャパンで働くメンバーには、自分で考え、やりたいようにやってほしい。その結果の責任は代表である私が取ります。メンバーの挑戦を下支えできる代表でありたいです」
多賀氏が言うように「2025年から日本でのAI活用が活性化する」ならば、それに向けた準備は今から始めておくべきだろう。AI開発の工程の7割にあたるアノテーションを、自社のビジネスプロセスにどう組み込むか。その見極めと体制作りが、AI開発の肝となりそうだ。
取材:佐藤 紹史
編集:岡 徳之
撮影:伊藤 圭
多賀 太
「大学卒業後、国内ソフトウェア企業を経て2006年よりSAPジャパンに転職。コンサルタント、プロジェクトマネジャー、ライセンス営業などを通して多くのEnterprise企業の業務改革、DXを支援。2022年よりアッペンジャパンで自動車業界のシニアセールスマネジャーとして活動し、2023年10月より代表に就任。45歳」