NECは、大規模言語モデル(LLM)を、ゼロから作り上げた数少ない国内企業の1社である。

そのLLMが、2023年7月に発表した「cotomi(コトミ)」だ。

  • PCからcotomiを使用している様子

    PCからcotomiを使用している様子

  • cotomiによるAIエージェントの活用事例の様子

    cotomiによるAIエージェントの活用事例の様子

発表当初には、cotomiの名称はなく、「NEC Generative AI Service(NGS)」のひとつとして提供されていたが、「NECのLLM」という呼ばれ方が定着する前に、独自の名称を決めることにした。

実は社内開発コードネームとして、「SAKURA」という名称があったが、同社の研究者や開発者、マーケティング、セールス、技術営業、デザイナーなど100人以上が参加したチャットグループを通じて正式名称を募集。そこで議論をしながら、50以上の候補のなかから名称を決めた。このとき、「NECのLLM」自らにも、「多くの人に親しみを持ってもらえる名称」を聞いてみたところ、cotomiそのものの名称は出てこなかったが、「Kotonomi」という、cotomiに近い名称が候補に出てきた。この意見も考慮しながら、最終的には2つの候補をもとに、グローバルに通用する名称として、温かみを持ったイメージがあるcotomiに決定した。

cotomiには、「ことばによって未来を示し、『こと』が『みのる』ように、という想いを込めた」という。

現在、cotomi Proとcotomi Fastを用意。今後、マルチモーダル化する際にも、それらにはcotomiの名称が使用されることになる。

  • 「cotomi」という名称には、ことばによって未来を示し、「こと」が「みのる」ように、という想いが込められている

cotomiは、独自の工夫により高い性能を実現しつつ、パラメータ数を130億に抑えており、軽量化することで消費電力を抑制するだけでなく、高速化も実現。クラウドだけでなく、オンプレミス環境での運用も可能だ。また、日本語の知識量や文書読解力を計測するベンチマークでは、世界トップクラスの日本語能力を達成。2023年7月の発表時点で、知識量に相当する質問応答で81.1%、推論能力に相当する文書読解においては84.3%と世界トップレベルの性能を達成した。その後も、日本語処理能力を向上させる改良を加え、長文プロンプトへの対応では、小説15冊分に匹敵する30万字の入力を可能にしたことで、社内外の業務文書や社内マニュアルなどをそのままプロンプトに入力でき、それぞれの企業が専用LLMを実現する上でも大きな効果と効率性を発揮している。

さらに、2024年12月にリリースしたcotomi V2では、推論能力の精度と推論速度を向上させ、生成AIを用いた高度な専門業務の自動化を実現し、AIエージェントの世界の到来を一気に引き寄せてみせた。さらに、2025年度には、cotomi V3へと進化させることも明らかにしている。

現時点では、医療、金融、製造の3つの業種を重点分野として、業務特化型のLLMを提供しており、今後は、複数の業種への新たな展開や、大手企業グループ向けの展開など、日本の企業を対象にした取り組みを中心に事業を展開する考えだ。

「cotomi」に至るまで、NECのAI開発史

NECのAI開発の歴史は長い。1960年代の手書き文字認識技術を皮切りに、すでに60年近い歴史を持ち、顔認証や虹彩認証のほか、群衆行動解析、インバリアント分析、データ意味理解、意図学習などの領域でAIを実用化してきた。とくに、自動認識AI、数理最適化AI、論理思考AIなどで多くの実績を持つ。

AIの評価として用いられる難関学会での論文採択数も、NECは、日本の企業として唯一、グローバル トップ10に入る実績を持っている。

  • NECはAIで多くの実績を持つ

これまでにも、AI技術ブランド「NEC the WISE」として、多様なAIを適切に組み合わせることにより、人の能力を補完し、さまざまな社会システムの活用を助け、豊かな社会づくりを目指してきた。

まさにNECは、「AIの企業」といっていい存在だ。それは、cotomiの独自開発により、改めて実証されたといっていいだろう。

なお、同社では「NEC the WISE」のブランドを2025年3月で終了。価値創造モデルである「BluStellar」に統合するとともに、今後は、cotomiのブランド訴求に注力することになる。

NECがLLMの開発に着手したきっかけは、2018年にまでさかのぼる。

NECの中央研究所からスピンアウトする形で設置されたコーポレート事業開発本部が、2017年に米グーグルが発表したTransformerを早い段階から活用。AI技術の拡張や、それを活用した事業化などに取り組むなかで、有望視された事業のひとつが、データ高品質化サービス「NEC Data Enrichment」であった。分析に活用するデータの質や量を高め、データ分析の高度化を支援するものだ。

さらに開発チームでは、ChatGPTにも着目。顧客が持つデータをプロンプトに入力すると、それにあわせて属性を抽出し、容易にデータに価値を付加することができるようにし、需要予測などに活用するサービスへと進化させてきた。

その一方で、2021年および2022年には、東北大学や理化学研究所、NTTなどの研究者たちが、質問応答技術研究の促進を目的として開催しているコンペティション「AI王 ~クイズAI日本一決定戦~」に参加。ここでは、NEC Data Enrichmentに採用している質問応答技術の客観的な実力を知ることや、より効率的な学習を模索することを目的としたものであったが、いきなり2年連続で優勝するという実績をあげている。

NECが、cotomiの開発を本格的にスタートしたのは2023年3月のことだ。

当時は、LLMは学習に使ったデータの量とパラメータの規模が比例関係にあり、パラメータ規模を大きくすることで全体的な性能を上げることが考え方の主流となっていたが、このころから、学習データの量や学習時間を増やすことで、高い性能を維持しながら、パラメータ数を大幅に削減する手法に注目が集まりだしていた。

とくに、NECでは、日本の企業が業務で使うことを前提にしたLLMの開発にフォーカスしており、そのためには、サイズを軽量化することで、業務アプリケーションで利用する際のレスポンスを高速化でき、オンプレミス化のハードルを下げ、秘匿性の高い領域などでも使える環境を実現することが望ましいと考えていた。

パラメータ数は1割以下、軽量高精度な独自LLM

NECは、こうした新たな動きを捉えて、軽量化した独自LLMの開発に着手したのだ。

このとき、研究開発の中心的役割を果たしたのが、NEC データサイエンスラボラトリーの主任研究員である小山田昌史氏だ。

社内コミュニケーションに利用しているSlackに、「Self LLM」の名称でチャンネルを作り、研究者に声をかけた。2023年3月28日のことだ。

「LLMを自前で開発し、実装するプロジェクトについて、直近1、2カ月間、作業をしてください」

cotomiの開発は、この日の、このメッセージで始まった。

開発に取り組んだのは、小山田氏を含む3人の精鋭研究者たちだ。まずは、AIに関する論文を読んだり、様々なLLMを対象に独自研究を行ったりしたほか、先に触れた「AI王」への参加を通じて蓄積したAI技術も活用し、ゼロからLLMを作るための準備を進めていった。また、NECでは2021年頃からRAG(Retrieval Augmented Generation:検索拡張生成)の研究にも取り組んでおり、この経験も独自LLMの開発に生かすことができたという。

研究者の一人は、「当時は、LLMの開発方法に関するまとまった論文がない状態だった。ビッグテックの手法を類推する一方で、個人がメモ書きしたような情報をかき集めた。それがかなり参考になった」と当時を振り返る。

2023年3月から4月第1週にかけて、目標とするパラメータサイズやアーキテクチャーに関する仕様を決定。このときに、NEC独自の学習手法を小規模で実験し、1週間で成果を得たことも、その後の開発促進に大きな影響を与えた。

当時は、GPT-3が1750億パラメータであり、その後もパラメータ数は飛躍的に拡大するという流れがあるなかで、NECは130億パラメータで、これらに匹敵する性能を実現できる手応えをすでに感じていたという。

  • cotomiは高い日本語性能を発揮する

  • cotomiは大幅な軽量化を実現している

このときに活躍したのが、NEC社内で本格稼働したばかりのAIスーパーコンピュータであった。研究チームは、これを活用することで、約1カ月で、「V1(バージョン1)」を完成させたのだ。

AIスーパーコンピュータは、2021年4月から構築を開始し、2023年3月に全面稼働したもので、GPU(NVIDIA A100)は928基、演算能力は580PFLOPSという国内最大級の規模と性能を誇っていた。

  • NECのAIスーパーコンピュータの概要

小山田氏たちは上司に掛け合い、LLMの開発のために、2023年4月上旬からゴールデンウイークまでの約1カ月間に渡り、本格稼働したばかりのAIスーパーコンピュータを独占的に利用し、LLMの開発を進めることができる許可を得た。その間は、まさに付きっ切りで作業を行い、実際に、1カ月という期間で「V1」を完成させてみせたのだ。

ゴールデンウイーク前までにすべてのデータを用意し、これをゴールデンウイーク期間中に学習させ、その時点では約7割の学習が完了。並行して会話を行うためのUIの開発に着手し、ゴールデンウイーク明けには完成させるというスピード感で開発したものだ。

  • cotomiの研究開発チームメンバーとAIスーパーコンピュータ(後列左が小山田昌史氏)

完成したLLM「V1」の精度は、かなり高かった。そこには研究チームが新たに突き止めた効率的に学習させるための独自のモデルトレーニングの手法が貢献していることが見逃せない。また、データ量を増やすためにNECは独自に日本語のデータを用意した。ここでは、NEC Data Enrichmentで培ったノウハウも活用している。これらのデータを、日本でトップクラスのAIスーパーコンピュータを利用して圧倒的な計算能力を確保し、非常に高い性能を現実的なパラメータサイズのLLMとして実現することができたのだ。

偶然? 目の前にあった国内最大級のAIスパコン

実は、AIスーパーコンピュータの稼働に際して、ユニークなエピソードがある。

LLMの開発に重要な役割を果たしたAIスーパーコンピュータではあるが、もともとはLLMの開発のために投資したものではなかった。

当初の目的は、NEC社内の研究チームが、それぞれに小規模のGPUサーバーを調達するのではなく、大規模なサーバーを構築し、これをタイムシェアリングすることで、リソースの大規模活用の実現と、効率化、コスト削減を目的にしたものだったのだ。

つまり、NECが独自のLLMを開発するというタイミングに、偶然にも目の前に、国内最大級のスーパーコンピュータが完成し、自由に使える環境が整ったともいえるのである。

  • NECのAIスーパーコンピュータ

NECの森田隆之社長兼CEOは、「ある日、研究所から、今後の研究開発を加速させるためには新たなスーパーコンピュータが必要であると言われた。いまのままでは答えを出すのに、何10時間も、何100時間もかかってしまうが、スーパーコンピュータに100億円投資してもらえれば、答えが数分で出るようになるという。これは、研究者の切なる声であり、これを聞いて、100億円の投資を即断した。結果として、LLMをいち早く開発することにつながった」と振り返る。

この投資を直談判したのが、NEC Corporate SVP兼AIテクノロジーサービス事業部門長兼AI Research Officerの山田昭雄氏だった。2021年11月のことであり、森田社長兼CEOの当時の役職は、CFO(最高財務責任者)であった。

NECは、2020年度における研究開発費の売上収益比率が3.8%であったが、これを2021年度には4.2%に引き上げている。金額に換算すると、年間120億円ほど増加しており、ちょうどAIスーパーコンピュータの投資額にあたる規模だったともいえる。

この投資決断は想定以上の成果を生んだ。こうした数年前からの取り組みがあったからこそ、NEC独自のLLMが迅速に開発することができたのは明らかだ。また、NECでは、このときのLLMの開発のように、一定期間に大規模なリソースを割り当てて開発するメリットを成功事例として蓄積することができた。今後も必要に応じて大規模リソースを集中的に活用するといったことが行われることになるだろう。そして、NECでは、AIスーパーコンピュータに対して、継続的な投資を行っていく姿勢も明らかにしている。

かつてないスピードで立ち上がる事業化プロジェクト

「V1」が完成する前は、研究部門の前向きな姿勢に対して、事業部門は、この研究にあまり期待をしておらず、そこには温度差があったのも事実だった。世界中に広く先行し、NECでも社内利用が始まっていたOpen AIのChatGPTを活用すればいいという機運があったからだ。

だが、目の前にそれとは異なる新たなLLMとして、完全動作するものが完成し、しかも、それをNECがゼロから作り上げ、軽量であること、日本語文書の読解力に優れていることを、事業部門は高く評価した。他社とは異なるNEC独自のLLMが、市場での競争優位性を発揮できると判断したからだ。

前述のLLM完成へ向かうゴールデンウイークを前後して、事業部門ではLLMの事業計画を立案。2023年初頭からスタートしていた「G2プロジェクト」のなかに、独自開発のLLMを盛り込む一方で、NECの生成AI専門チーム「NEC Generative AI Hub(NGH)」を2023年7月に設置したり、12社の民間企業および3つの大学との連携による「NEC Generative AI Advanced Customer Program(ACP)」によって、先行利用しながらAIフレームワークやモデルを開発し、金融や自治体、医療、製造などの業種特化モデルを構築したりといったことにも取り組んだ。

  • NEC Generative AI Advanced Customer Program(ACP)の概要

「G2プロジェクト」の旗振り役となったのは、Corporate SEVP兼CDO(Chief Digital Officer)の吉崎敏文氏である。日本IBMに長年在籍し、同社のAI(コグニティブコンピューティングシステム)であるWatson(現在のwatsonx)を統括するワトソン事業部長などを経て、2019年2月にNEC入りした。AIを活用するためのデータの重要性や、業務特化による差別化のメリット、ACPによる先行利用の必要性を熟知していた人物でもあり、その経験がcotomiにプラス効果になったともいえる。

G2プロジェクトの「G2」には、「GPTセカンドステージ」という意味がある。当時のLLMは、まだチャットボットや翻訳などの利用に留まっていたが、NECでは、その先にある特定業務や、特定の業種への活用を視野に入れ、それをセカンドステージと定義した。「G2」の意味は、NECのLLMが第2ステージに入ることを意味したものではなく、LLM全体の次の進化を捉え、NECのAI事業の方向性を示したものだといえる。

見逃せないのは、研究開発と事業化への取り組みが一体となり、市場アプローチを進めたことだ。LLMの狙いを業務特化であることを明確にした上で、そこにNECの技術力やシステムインテグレーションで蓄積した知見などを組み合わせ、cotomiをさまざまな業種に適したものに変えて、差別化することにした。

また、LLMが中心ではなく、顧客課題を解決するためにコンサルティング、システム設計、デプロイ、運用、メンテナンスまでを一貫して提供するなかで、LLMを活用すると位置づけた点もNECらしい考え方だ。

たとえば、ACPに参加した三井住友海上火災保険では、事故対応業務における顧客との通話内容を自動でテキスト化し、cotomiによって要約するシステムを開発。全国の「保険金お支払センター」へ導入することで、年間で約29万時間の削減を見込むなど、具体的な成果につなげる動きを加速させている。このように、業種や企業ごとの課題解決に活用するためのアプローチが基本となっている。

また、NGHは、2024年8月に、研究開発、事業開発、デリバリー、マネージドサービスを一気通貫で提供する「AIテクノロジーサービス事業部門」へと進化。生成AIで顧客ビジネスに貢献するAIのエキスパート集団として、生成AIの業務への有用性を検証し、導入から運用までの各種サポートをワンストップで提供している。

LLMの性能は、学習データ、計算機資源、アルゴリズム、大規模フィードバックの4つの要素で決まるが、NECは、それぞれにおいて強みを持っている。だからこそ、日本の企業向けに最適化した独自のLLMを開発できたといえる。

  • NECのLLM開発における強み

小さなサイズでありながら、日本語の能力、知識量や文章読解力では、海外トップのLLMに匹敵する性能であり、これをNECの技術力や知見をもとに、さらに改善を図ることになる。そして、高速性とともに、安定性を両立し、ミッションクリティカルを支えるLLMとして提供することができる。

社会価値創造型企業を目指すNECにとって、cotomiは、未来を担う重要な技術のひとつであることに間違いない。