
スマートファクトリー|DXとの違いや導入メリットを解説
2025-01-21
パテントマップとは?具体的な用途から導入方法まで
2025-02-13社長対談|製造業界におけるAI・DX推進の展望

対談者プロフィール
浦本 直彦 氏
花王 執行役員 デジタル戦略部門
データインテリジェンスセンター長
1990年、日本IBM入社、東京基礎研究所で自然言語処理、Webサービス、Webセキュリティなどの研究開発に従事。2017年、三菱ケミカルホールディングスに入社、2020年より執行役員CDOとしてDX推進をリード、2022年よりデータ&先端技術部ディレクターとして全社のデータ戦略を主導。2023年4月花王入社、2025年1月より、執行役員デジタル戦略部門データインテリジェンスセンター長として、データとそこから得られる知識を経営や事業の意思決定に活かすための活動行っている。2018年-2020年、人工知能学会会長。
下野 祐太 氏
株式会社エムニ 代表取締役CEO
大阪府出身。京都大学工学部卒業後、同大学大学院エネルギー科学研究科応用科学専攻。株式会社松尾研究所にて製造業向けのAI社会実装に3年間従事し、IoTセンサーを活用した異常検知及び原因特定、外観検査の自動化、生産計画の最適化にPMとして取り組む。他複数の有名テック企業にてプロジェクト経験多数。ビジネス面では松尾研にてコンサル営業に1年間従事。2023年10月株式会社エムニ創業。代表として経営を行う傍ら、自ら営業活動やデモ開発等のコーディング・マネージメント等幅広く業務を担当。
対談内容|大企業とスタートアップそれぞれから見る製造業界でのAI・DX推進への展望
花王株式会社 × 株式会社エムニ

インタビュアー
本日はよろしくお願いいたします。それでは、始めさせていただきます。
本日は、大企業とスタートアップ、それぞれの視点から見る製造業界でのDX推進への展望についてお話を伺います。浦本さんは長年、人工知能業界に携わり、人工知能学会の会長を務められたご経験があり、AI企業についても豊富なご知見をお持ちですよね。
浦本氏
そうですね。元々IBMで自然言語処理やWeb技術の研究開発を25年以上やっていて、その後三菱ケミカルグループに移り、現在は花王におります。人工知能学会の会長は、三菱ケミカルグループに在籍していた2018年から2020年まで務めていました。
はじめにお伺いしたいのですが、エムニさんは全員が松尾研の学生というわけではないのですよね?
下野
はい。エムニは全員が松尾研の学生というわけではなく、実は京大の学生が多いのですが、フルリモートのメンバーが多く、北海道から沖縄までいろいろなメンバーがおります。
浦本氏
エム二さんのビジネスモデルとしては、コンサルティングやカスタムソリューションを提供する形なのでしょうか?スタートアップといえば、いわゆるサービスプロダクト、例えばクラウドサービスのようなものを開発するか、あるいは受託でカスタムソリューションを提供するか、そのような選択肢があるイメージです。

下野
浦本さんがおっしゃる通り、受託開発を起点としてカスタムソリューションを提供しております。これらは製造業に特化して取り組んでおります。プロダクト概要について少しお話しますと、知財領域で、知財の分析や戦略立案、バイヤーのスキル強化などを生成AIで支援しております。少々ニッチな分野ではありますが、需要が集中する領域を狙っている点が特徴です。また、製造業ならではのホリゾンタルな課題として、技能伝承があります。熟練者へのインタビューをAIが行い、暗黙知を言語化することで、それを若手が活用できる仕組みを構築しています。たとえば、熟練者が「こういう状況ではこう考え、この技を使った」といった経験を基に、AIが具体的な解決策を提案できるようなサービスを提供しています。
浦本氏
これはAIソフトウエアがインタービューをするのですか?

下野
例えば、熟練の方が「こういう事象が起こったので、こう考えてこう対処した」とおっしゃっても、それだけでは全てを語り尽くせないと思うんです。熟練者が大切にしている背景や経験が必ずあるはずです。例えば、過去に同様の異常が起こった際に、他にどのような原因が考えられたのかなど、そういった情報をAIが深掘りし、暗黙知を一緒に言語化していくような仕組みを構築していく形になると思います。
浦本氏
それはぜひ、改めて詳しくお聞きしたいですね。(笑)処方や製造ノウハウが企業としての大切な資産となる製造業において、知財分野には確かなニーズがありそうですし、現場での技能継承は喫緊の課題です。目の付け所が素晴らしいと思いますし、特に今の時代、熟練の「神様」のような方々が少なくなってきていますから、そのような取り組みがますます大事になってくると感じています。
下野
機械化が進む中で、技能や知識をどのように残していくかが、ますます重要になっています。人材の減少という課題もありますが、機械化が全て良いとされる中で、技能や知識をいかに蓄積し活用するかが鍵となると思います。また、その蓄積方法がリスク管理やヘッジの観点からも非常に重要な役割を果たすのではないかとも考えています。
インタビュアー
今、AIがかなり進化しています。2025年は「エージェント元年」とも言われており、OpenAIをはじめとする企業からエージェントモデルが次々に登場しています。また、OpenAIのo1は4oと比べて推論能力が全く異なるレベルに達しており、従来苦手とされていた推論分野や論理的思考能力も対応可能になりつつあります。今年もかなりイノベーションが起きていくと思うのですが、今後、技術的な進化でどんなふうに現場が変化していくと思われますか。

浦本氏
確かに新しい技術がものすごい勢いで出てきています。今は事業会社にいるので、どちらかというと「使う側」の立場ですが、これだけ速いスピードで新しい技術が登場すると、事業会社側がそれについていくのは大変だと思います。今年は各社が「エージェント」や「エージェンティックワールド」といった話題を掲げています。それは素晴らしいことですが、一方で、個人的には単なるチャットボット的な会話だけでは、業務そのものの変革には繋がりにくいと感じています。エージェントのような生成AI技術が、業務に埋め込まれる形で使われ、自動化や業務改革につながるのが理想ですね。そのように活用されると非常に有効だと思います。
また、私はマルチモーダルにも期待を寄せています。私たちはお客様を「生活者」と呼んでおり、その生活者の声にいかに耳を傾けながら、生活を豊かにする製品を作るかが重要です。とはいえ、特にグローバルでは生活者の声を取得するのが難しい。ソーシャルメディアからデータを収集し分析することもしていますが、今はインスタのようなビジュアル重視の文化が主流です。例えば、どんなシチュエーションで花王の新製品が使われているのかを写真から読み取れると、テキストやXとは異なるコンテキストが得られるのではないかとおもっています。まだまだ課題がありますが、期待している技術です。

下野
基本的に同じ考えを持っていますが、少しエージェント、エージェントと言い過ぎている部分もあると感じています。
エージェント自体は素晴らしい技術だと思うのですが、今まさに技術発展中というか、RAGの延長線上でエージェントが語られる事に、私自身は違和感を感じています。まさに浦本さんのおっしゃる通りで、チャットボットのユースケースでは解決できない問題を、エージェントによって解決できるようになるという議論には、若干の違和感を覚えます。
これは昨年の春に発表された少し古いレポートですが、ある機関がまとめたもので、日本とアメリカで生成AIを実際に使った際、どちらの国が期待値を超えているかを調査した結果で、日本は導入スピードが早かったという話は松尾先生もおっしゃっていますが、期待値を超えたと回答した割合は圧倒的にアメリカの方が高かったんです。その理由を分析すると、どちらの国もユースケースに注目していますが、日本では「全社的に使う」というスタンスで、業務効率化の話が主軸となります。一方、アメリカではバリューアップや新規顧客開拓の向上に重点を置いており、そこが的確にはまることで、ユースケースが明確に見つかり、期待値が伸びているのだと自分は認識しています。
浦本氏
面白いですね。たとえば、マイクロソフトのAzure版生成AIサービスを全社で利用している会社が増えていますが、よく聞くのは、全社員のうち積極的に使う社員が数割いる一方で、役に立たないと使わない社員もいて、二極化してしまうという話です。また、使っている人たちも、業務を変革するとか、バリューアップのために十分活用できていない場合が多い気がしています。
30年以上前、私はNLP(自然言語処理)の研究者で、機械翻訳システムの開発を行っていました。当時は構文解析や意味解析、知識表現、文生成などが研究課題だったのですが、機械学習の登場で、文字列を入力するとブラックボックスな中間過程を経て結果が返ってくるエンドトゥエンドの手法で高い性能が得られるようになり、自然言語処理系の研究者たちに大きな衝撃を与えました。しかし、興味深いことに、社内文書を取り込むために、RAG(Retriever-Augmented Generation)のような手法を用いるわけですが、学習に使う文章やデータをある程度構造化しなければ、精度が出ないという課題も浮き彫りになっています。人間に見やすいように構造化された文書と生成AIシステムが理解しやすい文書の構造は違うと思います。先程の話にもありましたが、知識化、特に暗黙知を含めて、データをうまく構造化して精度の高い形でモデルに入力するかが大事だと感じています。
オールドファッションなアプローチかもしれませんが、大昔研究者だった者から見ると、文書構造の構造化や図と文章の関連付けなどの、いわゆる自然言語処理的な分析を取り入れると非常に面白いと思います。ただ、もしかすると半年後には生成AIがその課題を乗り越えてしまう可能性もありますが。機械学習が出てきた頃、知識はモデルに内在させるべきなのか、それとも独立した構造として存在させるべきなのかという議論をしていました。産業の技能継承に関しても、生成AIを使えば知識化が進むと思いますが、知識を人間とシステムの両方に理解しやすい形で表現できるのではないかと思います。そうした知識がどこに、どのような形で存在するのが最適か、というのは非常に重要なテーマだと思います。先程のお話を聞いて、改めてその点の使いどころの面白さを感じました。

下野
弊社のマルチモーダルについてお話しさせていただきたいのですが、今、テキストには限界を感じています。現場の方がテキストを読むことは問題ないのですが、入力する作業がかなり負担になっていて、製造業に限らず、建設系のお客様でも同様の課題があります。
やはり現場環境ではテキスト入力が難しい場面が多く、何か別の手法が必要だと感じています。
浦本氏
たしかに、現場では、常時手袋をしておく、両手が使えるようにしておく、といったことが安全のために必要ですが、細かな入力をするためには、手袋を脱いで操作しないといけないですね。
下野
それを踏まえると、弊社が今、すごく注目しているのが音声です。スピーチは、人の会話が音のやり取りで成り立つものなので、そのインターフェースにどこまで近づけるかが鍵になります。これは技術が出始めた当初から言われていることですが、特に注目している理由はリアルタイムAPIが登場したからです。今はレイテンシーが約1秒まで短縮され、人間と遜色ない会話が可能になり、会話中の割り込みも検知できるようになっています。現状はいわゆるカスケード的に文字起こしを行う方法が多く、ユーザーの感情やイントネーションの情報が失われてしまうことがありましたが、AIがスピーチの訓練を進めることで、人間と同じような知覚に近づくことが可能になります。これが実現すれば、現場の方々にもより使いやすいツールとして活用いただけるのではないかと考えています。

浦本氏
音声認識って、結構いろんな可能性がありますよね。例えば、オフィス系や本社系だと、会議の議事録を生成したいというニーズがあります。その際に、多人数の会議で誰が話しているのかを特定する話者同定や議論の関連付けの技術が重要になりますし、リアルタイム翻訳に繋げたいという要件も多いですよね。一方で、工場のユースケースは、作業員による「記録」や「参照」が主な目的になります。そうすると、音声認識そのものよりも、環境音の問題や、現場で配管の写真を一緒に撮ったり五感に関する情報を記録したりといった作業が重要になってくる気がします。音声認識も、使い方次第では非常に可能性が広がります。特に工場現場での認識には多様な応用が考えられて面白そうです。
下野
また、GPTが登場して1年後にLlama3が出てきたことを考えると、私の感覚では、クローズドな技術が出た後、それに応じてオープンなものが登場するまで大体1年くらいだと思っています。リアルタイムAPIが出てきたのが昨年の10月少し前だったと思うので、これまでの流れからすると、英語版ではSpeech to Speechのモデルがオープン化されているものがあり、希望的観測も含まれますが、今年の8月から9月頃にはリアルタイムAPIの技術がさらに進化して、花開いているのではないかと予想しています。
そうした技術が成熟してくるタイミングで、現場でのオンプレミス対応も考えています。こういった技術の動きに早めに注目しておくことが非常に重要だと考えています。
浦本氏
広くて工場設備が複雑な工場だと、そもそも無線が届かないとか、そういった話もあります。そうすると本当にオンプレというか、エッジみたいな話もあるかもしれないですね。

インタビュアー
製造業にAIを入れる課題について、お二人はどのようにお考えですか?
下野
よく言われる課題は2つあると思っています。1つ目はおそらくセキュリティの部分です。製造業の工場というのは、製造業の会社にとって心臓部分なので、基本的に外部と完全に切り離されています。そういった環境で対応ができないと、そもそも議論の土俵に上がれない場面が多いと思います。もちろん、ユースケースや取り扱うデータの内容によるとは思いますが、セキュリティをどう担保するのか、あるいはクラウドを使う場合に、どう納得感のある説明を行うのかといったロジックが欠けていると、導入は進まないのかなと感じています。
2つ目は、どれだけ現場目線で取り組めるか、現場の方々に違和感なく導入いただけるか、という点です。よくあるのが、情シスやDX推進担当者と我々AIベンダーが中心となって構築したものの、現場に浸透せず使われなくなるケースです。こうした事例は本当に多いですね。ここには教育的な要素も関わってくるかもしれませんが、技術者である私たちとしては、UXやUI、さらには音声インターフェースなど、どれだけ現場で使いやすい形に追求できるかが鍵だと思います。これが、AI導入を進める上で非常に重要な要素だと考えています。

浦本氏
面白いですね。僕も2つあると考えています。下野さんの考えと似ています。まず、機械学習もそうですが、結局100%の精度にはならないですよね。前の会社では工場で生産した製品の外観検査のプロジェクトをやったことがあります。フィルムの生産ラインだったのですが、最終過程で、フィルムによじれや白濁点がないかを目視で確認していたのをカメラで撮影して機械学習モデルを使って判断する形にしました。でも、NGデータが少ないので学習データを水増ししたりしても、8-9割程度の精度しか出ませんでした。そうなると、現場の人たちから「100%でないと使えない」とよく言われます。人間だって時には間違えるのに。だからこそ、100%の精度でなくても、人間とシステムがうまく協調する形にすることがとても大事だと思います。
生成AIも同じだと思います。今でも時々変な回答をしますよね。「ハルシネーションがあるから駄目だ」と言って使わないのか、それとも使える部分で活用するのか。生成AIが生き残れるかどうかは、事業側がそれを使い続けられるかどうかにかかっていると思います。
もう1つは、結局、現場で、例えば異常検知や外観検査、生成AIなどを導入しても、それが作業員の業務に埋め込まれて仕事の一部として継続的に使われないとダメなんです。たとえば、毎朝見る計器パネルに常時結果が表示されているとか、アラートが上がったら、どのような作業を行うかが手順化されている、といった形ですね。いろんな技術を現場に導入しようとしても、最初はいいんだけれど、業務の中にきちんと埋め込まれなければ長続きしない。製造業におけるAI活用では、この点がとても重要だと思います。

インタビュアー
ありがとうございます。最後にお二人に今後のビジョンをお聞かせいただきたいと思います。
浦本氏
花王は2018年からDXの組織を作り、いろいろな取り組みをしてきました。進んでいる活動も多く、例えば現場の方がローコード開発ツールを使って現場の課題を解くシチズンデベロッパーの活動が非常に盛んです。それはすごく素晴らしいと思うんです。そこで、さらに次段階へ進化するにはどうしたらいいかを考えています。たとえば、BIツールで作ったレポートが山のようにあるけれど、それが経営や事業、現場の人の意思決定にどれだけ役立っているのか、そこにはまだギャップがある気がします。
そこで、昨年から「データインテリジェンスプロジェクト」を始めました。データだけではダメで、それを知識に変え、それをもとに意思決定し、アクションを取る、その過程を支援することが重要だと思っています。たとえば、単にグラフを見せるだけではなく、「なぜそうなっているのか」や「原因」を教えてくれる仕組み、さらには「ここをこう変えたら売上が増える」というシミュレーションや最適化の機能が必要です。そうした次の段階に進むべき時期が来ていて、今、一生懸命取り組んでいるのがその部分なんです。生成AIは、その点で使い勝手が良いと感じています。
例えば、表データの分析や表示も可能になってきたので、パワーBIレポートのようなものも「あらかじめ作る」のではなく、「これとこれでレポートを作ってね」と指示できないか。そのあたりのニーズをうまく生成AIを使ってもできないかというのが、今、野望としてある感じです。

下野
最近、キャッチコピーにしようと思っているのですが、「日本の製造業におけるAI活用のハブになる」というのが、自分の中で考えているビジョンの答えというか、目指す姿です。これは日本特有の事情も関係していて、よく言われるのが、アメリカにはSIerがなくて自分たちで開発するのに対し、日本は外部のSIerに頼る構造があるという点です。そのため、「SIerがあるから日本でDXが進まない」とも言われます。ただ、私はこれを逆にメリットにできると考えています。つまり、私たちは製造業という業界において、DXやAI活用のプロフェッショナルとして、たとえば自動車業界のお客様にはこうした課題があって、こういう落とし穴がある、といった知見をどんどんエムニに蓄積していく。その知見が他の業界、たとえば鉄道や部品製造といった分野にも応用できることは十分にあると思います。
エムニとしてノウハウを蓄積し、ハブとなることで、多くの製造業のお客様のAI活用や価値創出を支援し、日本全体の製造業を活気づける一助になれるのではないかと考えています。各社が個別に持っているノウハウを抽象化して整理し、それをさらに各業界にアジャストして提供することで、「AIのハブ」を実現できるのではないかと。これは、私たちが製造業に特化し、かつ受託開発という形を取っているからこそ目指せるポジションであり、私たちが目指すべき姿だと思っています。
浦本氏
なるほど。。。製造業同士をつなぐみたいな意味合いもあるんですか。
下野
そうですね。そういうところももちろんあります。
浦本氏
日本企業は、あまり企業同士が繋がったり、データを共有しましょう、というような流れにはなりにくいと感じています。そこはとても重要な部分なので、エムニさんのような会社がハブとしてうまく繋いで、業界全体でベストプラクティスを作っていくことが大事だと思います。80年-90年代くらいに第2次AIブームがあったのですが、当時はデータや計算機パワーが足りなかったということもあり、AIの活用に対して、事業側や産業界側があまりついていけなかったんです。論理型マシンやエキスパートシステムのようなものはあったけれど、リアルなユースケースを解決するような方法やシステムがなくて、大学や研究所の中だけで限られた人が使うものになっていました。でも、機械学習や生成AIの時代になってからは「民主化」が進み、企業や個人でも自由に使えるようになったのは非常に大きな変化です。ただ、このままではまたブームが終わってしまう可能性もあります。それを防ぐためには、産業界がしっかり盛り上げていく必要があり、1社だけではできないことも多いのが現状なので、業界全体がうまく繋がり合うことが、これからますます重要になると思います。
下野
おっしゃる通りだと思います。例えば、生産計画を1社だけで最適化しようとすると、全体的に見ると局所解に留まってしまうケースが多いですよね。それぞれの企業が個別に最適化を図るだけでは、どうしても全体的な効率や効果が十分に発揮されにくくなります。しかし、課題を全体で捉え、調達可能な部分や他社との連携を含めて最適化を進めることで、より大きな成果を生み出すことができると思います。例えば、CO2の削減や工数の削減、さらには費用削減につながるだけでなく、材料の無駄をなくしたり、ロジスティクスの効率化を実現したりすることが可能になります。こうした効果は、単に1社の利益にとどまらず、業界全体や社会全体にポジティブな影響を与えるものだと考えています。そういった広い視点で課題にアプローチし、包括的な最適化を実現していくことが、本当にやりたいことに非常に近いイメージで、最終的には、製造業界全体をより良い方向に導いていきたいですね。

エムニでは製造業に特化したAI導入を行い、企業様と伴走しながら継続的な支援を提供しております。技能伝承に関する事例もございますので、AI導入や関連する取り組みをご検討の際は、ぜひ無料相談をご利用ください。