AI時代のデータ活用に不可欠な高度なデータガバナンスの実現3つのポイント

AI時代のデータ活用に不可欠な高度なデータガバナンスの実現3つのポイント


2023年12月14日、「AI時代のデータ活用に不可欠な高度なデータガバナンスの実現3つのポイント」とし題し、オープンテキスト社と共催したウェブセミナーの内容を、本記事ではまとめてお送りします。


要点

  • 生成AIは幅広く活用できる一方、多様なリスクが存在しており、すでに訴訟となったケースも。
  • AIの開発・運用・活用にあたってはフレームワークなどを用い、AIシステムや体制を整備していく必要がある。
  • 生成AIを目的と捉えず、日頃から適切なドキュメント管理を行いリッチでシュアなデータを蓄積していくことが結果的にAIの利用価値を高める。

講演1 AI利活用の促進とリスクへの対処―AIガバナンスの必要性と取り組み

生成AIの活用が急速に広がる中、世界各国ではその運用や規制への対応に追われています。AIを正しく利用し、そのメリットを享受するためにはどのようなことに注意すればよいのでしょうか。
米国・欧州等におけるAIガバナンスの状況、そしてAI利活用にあたり企業が把握すべき観点や取り組みについて、EYストラテジー・アンド・コンサルティング株式会社シニアマネージャーの菅 達雄が解説しました。

EYがAPACで行った調査(EY CEO Outlook Pulse)では、7割近くのCEOが「競合に対して戦略的に劣後することを防ぐため生成AIへの取り組みが必要であるが、同時に生成AIの不確実性が課題とも認識している」と答えています。

「この結果から読み取れるのは、生成AIに非常に期待をしつつも捉えどころのない不確実性があると考えている方が多いということです。こういった観点からもAIガバナンスが非常に重要であることがわかります」と菅は述べます。

AIガバナンスの在り方を考える上で知っておかなければならないのがAI利活用のリスクです。

出力結果が必ずしも正確・最新であるとは言えない「信頼性と正確性」、個人情報や機密情報が意図せず外部に漏えいし不正利用される「プライバシーとセキュリティー」、出力結果が社会的な公平性に欠け、バイアスを有する「公平性とバイアス」、そして、著作権などの権利を意図せず侵害することによる「コンプライアンス」違反など、AI利活用のリスクは大きく分けると4つあります。

ディープフェイクを使った著名人の動画流布やAIを利用したサイバー攻撃実験での不正送金、そしてAIを利用した保険適用判断に関する訴訟などは、これらのリスクがすでに顕在化している事例であると言えます。

「AI利活用のリスクはさまざまに変化しており、今まさに、インシデントのデータベース化が進んでいます。今後、企業がAIガバナンスを実装する際、同業他社のインシデントの事例を知るには、このようなデータベースが参考になるはずです」(菅)

そして話は本題であるAIガバナンスへと移ります。
「AIガバナンスとして、世界的に確立されたひとつの考え方があるわけではありません。そこで、Global Partnership on AI(GPAI)(2024年4月1日アクセス)での取り組みを例にご説明します」と菅。

2020年に設立されたGPAIは、責任あるAIの開発・利用を実現するために設立された官民連携の国際組織です。

「責任あるAI(サブグループ「AIとパンデミック対応」含む)」「データガバナンス」「仕事の未来」「イノベーションと商業化」の4つの作業部会があり、世界中の研究者・実務家によりさまざまな議論が行われています。

「注目すべきは、「責任あるAI」と同じレベル感で、「データガバナンス」が議論されている点です。データガバナンスがAIガバナンスの一部であるという考え方はもちろんのこと、非常に重要な論点であると示唆されているのは間違いないでしょう」(菅)

さらに、AIガバナンスの全体像を把握するにはフレームワークのようなものが必要であると菅は述べます。

「まず、すべてのステークホルダーが順守すべき基本的な原則が必要です。その上で2つの観点を取り入れていく。まずは、AI開発・運用・利用に関わる関係者が適切に利益を享受し、不利益を被らないよう担保しなければならない。これにはAIを利用する労働者や膨大なデータを計算処理するための環境も含まれます。さらに計算資源、データ、人材という3つの資源からの観点を取り入れていきます。

AIをどう利活用するのかユースケースを決め、システムの仕様を検討し、それを継続的に運用するための統制・管理の仕組みを考える。この全体像がAIガバナンスであると私たちは整理しています」

AIの活用が加速度的に進む中、世界では規制・標準化に向けた動きが活発化しています。

「先ほど例に出したOECDのAIに関する政策ガイドラインは2019年に採択され、各国の規制整備の基準となりました。しかし生成AI利活用の高まりを受け、見直しの検討に入っています。EUにおけるAI法では、AIシステムをリスクに応じて4分割し、利用する事業者などに義務を課すことを検討しています。また、米国の標準化団体NISTが作成したフレームワークやプレイブックは、企業などがAIに関するリスクマネジメントの仕組みづくりをする際の参考とされており、ガバナンスについても同様にヒントとなるでしょう」(菅)

企業における取り組みとしてご紹介したいのが、ISOのフレームワークです。

ISOではAIマネジメントシステムの規格化(ISO/IEC42001)を進めており、近く公表される見込み1です。

「AIガバナンスが非常に広範にわたる中、データという観点ではISOのコントロールをモデルとして各企業でガバナンスを具体化していくことができると考えています。

実装方法としては他のマネジメントシステムと基本的な考え方は同じですが、AIでポイントとなるのが現状評価です。AIがすでに各社・各組織の中で使われており、懸念されるリスクが顕在化している可能性を考え、自社や委託先でAIがどう使われているか、まずは現状の評価と洗い出しから始める必要があるでしょう」(菅)

EYでもAIガバナンスのフレームワークをつくり、AI原則、開発ライフサイクル、リスク管理を検討し、AIの信頼性を高めるための要件を定義しています。
菅は「各社が状況に応じたフレームワークを今後考えていく中、こうしたところに取り組むことでより効果の高いAIを実現できるのではないかと考えています」と語り、講演を締めくくりました。

講演2 来るべき生成AIのビジネス活用に向けて、今から取り組むべき3つのキーポイント

生成AIをビジネスで利活用したいと考えながらも、活用方法がわからない方は多いのではないでしょうか。

本セッションでは、次世代型Saas文書管理サービスであるOpenText Core Content、OpenText Content Aviator2を題材に、具体的なビジネス活用例と留意点をご紹介。また、AIのリスクを踏まえた上で今取り組むべき3つのキーポイントとAI利活用の実践的なシナリオについて、オープンテキスト株式会社ソリューションコンサルティング本部リードソリューションコンサルタント西野寛史氏に解説いただきました。

カナダに本社を置く独立系のソフトベンダーであり、クラウドサービスプロバイダーでもあるオープンテキスト株式会社。ECMと呼ばれる文書管理においては、多くのグローバルなリサーチ企業からリーダーの評価を17年以上継続して受けている企業です。

「AIについて、便利そうではあるものの、ビジネスにどう生かせばよいのかイメージが湧かないといった声をよく耳にします。さらに、セキュリティー、プライバシーへの懸念やコストとリターンといった課題もあります」と西野氏。

西野氏は、企業には大きく分けて2種類のデータソースがあると言います。

「全体の2割を占めるのが基幹システムや会計システム等の構造化データ。残りは非構造化データである文書です。この非構造化データは従来非常にナレッジ化が難しかった分野ですが、生成AI、LLMの登場によって一気にブレイクスルーするところにきています」

オープンテキスト社では、これらの課題解決のために、生成AIとドキュメント管理を統合したソリューション「OpenText Core Content 」が開発されました。長文で難解な契約書の要約や会話型検索機能を用いた質問など、生成AIの支援によって必要な情報に効率的にリーチできます。


OpenText Core Content

これらの機能について、西野氏は主に4つのユースケースをあげました。

「ひとつめが「戦略的な情報活用」。例えば企業の調達業務で契約をする時に、100社の中から要件を満たして最もコストパフォーマンスが高い企業を選ぶ必要が出たとき。そして2つめが「技術情報の共有」。突然、大量の文書とともにプロジェクトを引き継ぐことになった際、いち早く内容を把握するのに会話型検索の要約が役に立つでしょう。3つめとして、資料は大量にあるのに教わる人がいないという、今後ますます増えることが予想される「団塊世代の技術継承」。そして4つめが、「不正・係争対応のリスク低減」です。例えば内部不正があった際、大量の文書を人海戦術で見ていくことは大きなリスクになり得ます。ここでも会話型検索や要約といったテクノロジーを使うことで、かかる時間を最小化できます」

このように便利である一方、生成AIには思わぬリスクも潜んでいます。西野氏は3つのキーワードで警告します。

「まずは「“うそつき”なAI」です。これはいわゆる正確性のリスクです。AIはデータの新旧の判断がつかないため、古い情報や間違った情報を回答に含めてしまうことがあります。これに対処するにはガバナンスの効いた版管理が必要になってきます。

次に、セキュリティー、プライバシーのリスクを表現した「“おしゃべり”なAI」。これについては権限管理をしっかりすることが重要なポイントです。

そして「“視野の狭い”AI」。データの多様さがAIの回答の多様さに直結してくるため、でたらめな多様性ではなく、コンテキストを持たせた上で統合することが重要です。そのためには文書の一元管理を徹底しなければなりません。これらが3つの重要なポイントになります」

西野氏の解説から、生成AIを活用していくために文書管理を徹底することが重要であることがわかります。しかしながら、AIのためだけに多量のコンテンツを整理して文書管理をするのはコストに見合いません。

「通常業務の中できちんとした文書管理を行い、リッチでシュアなデータを継続的に蓄積することこそが、生成AIの利用価値向上につながるのです」(西野氏)

このコンセプトに基づいてリリースされたものが、SaaSサービス「Core  Content」です。

「SaaS型クラウドストレージの利点と高機能な文書管理が行える機能を持ち合わせているのが大きな特徴です。日々の業務の中で文書のデジタル化や管理を行いながら、他社のビジネスアプリケーションと連携する機能を持っています。また、お客さまご自身のプライベートクラウド内にベクター・データベースを配置。データ・プライバシーで企業データを保護します」(西野氏)

西野氏は、「ビジネスで生成AIを生かすには、非構造化データの80%を有効活用し、文書管理や権限管理、版管理などをしっかりと行うことが大前提です。日頃の業務の中で適切なドキュメント管理をしていくことが結果としてAIの利用価値を高めます」と述べ、講演を終えました。

Q&A


最後に、皆さまから頂いたご質問に菅と西野氏がそれぞれ回答しました。


「AIに学習させるためのガバナンスの在り方(ルール化)が現状の課題です」という質問に対して、西野氏は技術的な観点から「やはりガバナンスを効かせることが重要で、そのための手段として有効なのがきちんとした文書管理です」と回答。一方、菅はガバナンスのルール化といった観点から、「AIには学習データの増加によって性能が飛躍的に向上するスケーリング則というものがあります。しかし、最近の研究では単にデータ量を増やすだけではなく、質や密度も重要だという話もあり、AI開発チームと連携しながらのルールづくりが求められます」と答えました。


2つめの質問「AI活用のリスクをどう捉え、対応すべきなのか。そしてアウトプットの信頼性をどう確保するのか」には、菅が「フレームワークなどに依拠しながらAIの信頼性を確保し、プライバシーやセキュリティーを守っていくのはもちろん重要です。しかしそれを全部やろうとするといつまでたってもAIは使えません。まずはAIがどこで使われているのか、機能性能はどうなのか、それが自社の業務にどういうリスクをもたらすのか、そのリスクを回避するための対策を考えることで施策を打っていくことができるのではないでしょうか」と回答しました。


最後の質問は、「いまだどのような業務で生成AIを活用して成果を出せるかわかっていない」というもの。


西野氏は「仕入れ先を選ぶなど攻めの意味での活用もありますが、不正係争対策などリスクを下げるという守りの活用もあります」と回答。


一方管は、「システム部門のみならず、データサイエンティストのチーム、プライバシーのチームなど、さまざまな関係者に声をかけ、目指すべき業務が達成できるのかどうかをチームで検討していくことが重要です」と業務観点からのアドバイスを述べました。

脚注

  1. ISO/IEC 42001:2023 - Artificial intelligence — Management system www.iso.org/standard/81230.html(2024年5月1日アクセス)※2023年12月に公表
  2. Generative AI Content Management & Assistant | OpenText Content Aviator www.opentext.com/ja-jp/solutions/content-aviator(2024年5月1日アクセス)

関連コンテンツ

リスク

最先端のリスクマネジメント手法によって、いかにして信頼と確信を持ってディスラプションを受け入れ、価値の創造と競争力の強化が可能となるかをご紹介します。


データガバナンス

DXの成功の鍵は、その基盤となるデータやテクノロジーの「確かさ」にあると私たちは考えます。最も重要なのは、確かなデータを組織として担保する枠組みを整備すること、そしてそれを支える最新テクノロジーの信頼性を担保することです。




サマリー

生成AIをビジネスに活用する動きがますます活発になる中、そのリスクを考慮した上でしっかりとしたAIガバナンスを効かせることが不可欠です。また、生成AIをビジネスで効率的に活用していくためには、日頃からのドキュメント管理が重要になります。


この記事について