オープンソースLLMまとめ!日本語対応LLMのメリットと注意点を徹底解説

最新記事

近年、急激な進化を遂げている生成AI。画像や文章の生成など個人的に楽しむために利用している人や、カスタマーサポートやCM作成など企業で利用されることも多く、ビジネスを加速させるツールとしても活躍しています。

しかし、コスト面や使いたい機能が使える生成AIが見つからないということで導入が進まない企業もあるでしょう。そんなお悩みの方におすすめなのが、オープンソースLLM(大規模言語モデル)です。

この記事では、オープンソースLLMの概要やおすすめの日本語対応オープンソースLLMについてご紹介します。ご紹介するツールごとに、商用利用が可能かどうかについても解説しているので、ぜひ最後までご覧ください。

オープンソースLLMとは

オープンソースLLMとは、誰でも無料で利用できる大規模言語モデル(LLM)のことで、ソースコードやアーキテクチャも公開されており、独自のニーズに合わせて自由にカスタマイズを行うことが可能です。

それに対して、OpenAIのChatGPTやGoogleのGeminiなどのクローズドLLMは、個人や企業が単独で所有する独占的なAIモデルなので、ソースコードの一般公開もされておらず、利用するためには無料、もしくは有料プランに加入して利用する必要があります。

クローズドLLMは高性能かつ簡単に利用ができるところが利点ですが、コスト面やカスタマイズ性に欠けるところもあるため、LLMについての知識がある人はオープンソースLLMを選ぶことが増えています

なお、クローズドLLMについて詳しく知りたい方は、下記の記事を合わせてご確認ください。

オープンソースLLMを利用するメリット

前述でも少し触れた通り、オープンソースLLMを選択する人や企業は増えてきていますが、オープンソースLLMにはいったいどのようなメリットがあるのでしょうか。

次に、オープンソースLLMを利用するメリットについてご紹介します。

コストを抑えることができる

ChatGPTやGeminiといったクローズドLLMを利用する場合は従量課金制が一般的で、頻繁に利用したり大量のデータを処理する場合は、コストが高額になる可能性があります。

しかし、オープンソースLLMを活用すれば導入コストはかかるとはいえ、それ以降のコストはかからないので、長い目で見ればコストを抑えることができるでしょう。

また、自社に専門的なスキルを持った人材がいれば、導入コストやメンテナンスにかかるコストも抑えることができるので、お得に利用することができます。

自由にカスタマイズできる

オープンソースLLMは、前述の通りソースコードやアーキテクチャ、学習データなど、LLMの内部構造も公開されておりアクセスすることができます。そのため、悪意のあるプログラムが含まれていないかしっかり精査することができます。

また、ニーズに合わせてカスタマイズすることもできるので、技術力さえあればクローズドLLMではできなかった業務をこなせる独自のLLMを作ることができます。

オープンソースLLMを利用する際の注意点

メリットを見ていただいてわかる通り、コストもかからず自分の好きなようにカスタマイズができるオープンソースLLMは、今後さらに普及が進んでいくことが予想されます。

しかし、利用するにあたって注意しなければならないこともあります。次に、オープンソースLLMを利用する際の注意点について見てみましょう。

悪意のあるコードが含まれている可能性がある

オープンソースLLMは、ソースコードやアーキテクチャ、学習データなど、LLMの内部構造に誰でもアクセスできることはメリットでもご紹介しました。しかし、このカスタマイズ性の自由度がリスクになり得る可能性があります。

例えば、導入したオープンソースLLMに情報を抜き取ることやPCをクラッシュさせるなどといった悪意のあるコードが含まれている可能性があります。もちろん、導入前にしっかり精査すれば、そのようなことは起きませんが、導入後に仕込まれてしまっては防ぐことは難しいでしょう。

そのため、導入前には利用するオープンソースLLMの精査をしっかり行い、導入後は権限のある人間だけが触れるようなセキュリティ対策を行うことが重要です。

専門的なスキルが必要

クローズドLLMは、オープンソースLLMに比べて自由度はありませんが、定期的にアップデートがされるため、LLM自体のメンテナンスは必要ありません。しかし、オープンソースLLMに関しては、アップデート等のメンテナンスを手動で行う必要があります。

また、クローズドLLMに比べて利用者は少なく、欲しい情報がインターネット上にない場合もあるので、その都度、問題があれば自分で解決する必要があります。

そのため、LLMに関する専門的なスキルがなければ使いこなすことは難しいでしょう。

日本語対応しているおすすめオープンソースLLM6選

最後に、日本語対応のオープンソースLLMを6つ紹介します。

それぞれの特徴はもちろん、商用利用が可能かどうかについても解説しているので、オープンソースLLMの導入を検討している方は、ぜひ参考にしてください。

①Llama 3.1

Llama 3.1は、2024年7月24日にMeta社から公開されたオープンソースLLMです。

中でもLlama 3.1 405Bというモデルは、4050億のパラメータと128,000のコンテキストウィンドを有する超高性能モデルで、その性能はGPT-4oやClaude 3.5 Sonnetと同等かそれ以上と評価されています。

ベンチマークのスコアを見ても、クローズドLLMに引けを取らないスコアを出していることから、現時点のオープンソースLLMの中では最高の性能を持っているオープンソースLLMと言えるでしょう。

しかし、商用利用については、条件がある場合があるので利用規約をしっかり確認しましょう。

なお、Llama 3.1について詳しくはこちらを参考にしてください。

②PLaMo

PLaMoは日本企業である株式会社Preferred Elementsによってフルスクラッチで開発された大規模言語モデルです。

独自構築したアーキテクチャや学習データで0からの事前学習・指示学習を通して開発されたPLaMoは、他社モデルをベースにしていないモデルのため、社外のライセンス縛りや開発上での不明瞭な点の存在しないモデルとなっています。

また、主要な日本語のベンチマークにおけるスコアは、GPT-4を超える性能を持っていることから、世界最強レベルの日本語能力を持ったオープンソースLLMと言えるでしょう。

しかし、トライアルAPIについて、商用利用は可能ですが、ライセンスに関する細かい内容は発表されていないため、商用利用する場合は注意が必要です。

なお、PLaMoについて詳しくはこちらを参考にしてください。

③Phi3.5

Phi3.5とは、これまでMicrosoftからリリースされていたPhi-3で使用されたデータセットを基に構築された、オープンソースLLMです。

ベースとなっているPhi-3には、スマートフォン上でのローカルな推論を可能にするほど小型でありながら、GPT-3.5などのモデルに匹敵する全体的なパフォーマンスを実現するPhi-3-miniや、70億パラメータのPhi-3-smallと140億パラメータのPhi-3-mediumなど、幅広いモデルが用意されていました。

そのため、Phi3.5にもPhi 3.5 mini instruct、Phi 3.5 MoE、Phi 3.5 Vision instructの3つが用意されており、利用する用途やデバイスによってモデルを選択することができます。

Phi3.5については、基本的に商用利用や改変、私的利用など全て可能となっています。

なお、Phi3.5について詳しくはこちらを参考にしてください。

④Mistral Nemo

Mistral Nemoとは、フランスのMistral社が米Nvidia社と共同で開発したオープンソースLLMです。

このモデルは、12Bのパラメータと128Kのコンテキストウィンドウを有しており、推論やコーディング能力などの点でGemma 2 9BやLlama 3 8Bを上回り、このクラスのモデルの中では最高の性能を持っています。

さらに、日本語を含む多言語対応や、様々なモデルで使用される標準アーキテクチャを採用しているので、幅広いタスクに利用できるオープンソースLLMと言えるでしょう。

ライセンスについては、Apache License 2.0のもとで提供されているため、商用利用や配布等を行うことができます。

なお、Mistral Nemoについて詳しくはこちらを参考にしてください。

⑤Gemma 2

Gemma 2は、Googleが開発したAIモデルであるGeminiと同じアーキテクチャを用いて構築されており、軽量でありながら高い性能を持つオープンソースLLMです。

Hugging Face Transformers、JAX、PyTorch、TensorFlowなどの主要なAIフレームワークと互換性があり、簡単に利用できます。さらに、NVIDIA TensorRT-LLMを使用してNVIDIA製のインフラ上でも最適化されています。

Gemma 2は商用に適したApache License 2.0に基づいて提供されているため、ビジネスでも安心して利用できます。

なお、Gemma 2について詳しくはこちらを参考にしてください。

⑥CyberAgentLM3-22B

CyberAgentLM3-22B(CyberAgentLM3)は、日本の企業であるサイバーエージェントが公開した日本語特化のオープンソースLLMです。大量の日本語データを用いてトレーニングされ、約225億のパラメータを有しています。

その日本語能力は、Meta社が開発したLlama-3-70B-Instructと同等であり、独自開発されたオープンな日本語LLMとしてはトップクラスの性能をもっているとされています。

CyberAgentLM3についても、Apache License 2.0のもとで提供されているため、商用利用や配布等を行うことができます。

なお、CyberAgentLM3-22Bについて詳しくはこちらを参考にしてください。

かゆいところに手が届くオープンソースLLM

生成AIを使う際にはプライベートやビジネスなど関係なく、使いたい機能が使えなかったり、あれができたらいいのにな、といった願望が出てくることが多いと思います。

確かに、ChatGPTやGeminiなどの有名企業が展開しているクローズドLLMを利用することで安定的な回答を得られたり、安全性についても高いといえるでしょう。

しかし、知識と技術力があればオープンソースLLMを活用して、やりたいことに特化したオリジナルの生成AIを作れる可能性があります。

このように、オープンソースLLMはカスタマイズのやり方によっては、かゆいところに手が届く最強の生成AIを生み出すことができるので、興味のある方は、一度オープンソースLLMを利用してみてはいかがでしょうか。

サービス紹介資料

生成系AIの業務活用なら!

・生成系AIを活用したPoC開発

・生成系AIのコンサルティング

・システム間API連携

・マーケティングやエンジニアリングなどの専門知識を学習させたAI社員の開発
・要件定義・業務フロー作成を80%自動化できる自律型AIエージェントの開発
・生成AIとRPAを組み合わせた業務自動化ツールの開発
・社内人事業務を99%自動化できるAIツールの開発
ハルシネーション対策AIツールの開発
自社専用のAIチャットボットの開発

無料で相談する

生成AIを社内で活用していきたい方へ

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。

セミナー内容や料金については、ご相談ください。

また、大規模言語モデル(LLM)を対象に、言語理解能力、生成能力、応答速度の各側面について比較・検証した資料も配布しております。この機会にぜひご活用ください。

タイトルとURLをコピーしました