ELYZAは、Meta社の「Llama 3」を基にした最新モデル「Llama-3-ELYZA-JP-70B」と「Llama-3-ELYZA-JP-8B」を開発し、その性能を公開しました。
このニュースのポイント
- ELYZAが「ELYZA LLM for JP」シリーズの最新モデル「Llama-3-ELYZA-JP-70B」と「Llama-3-ELYZA-JP-8B」を公開
- 70Bモデルは「GPT-4」や「Claude 3 Sonnet」を上回る性能で、企業向けに提供される予定
- 8Bモデルは「GPT-3.5 turbo」を上回る性能で、研究や商業目的での利用が可能
株式会社ELYZAは、大規模言語モデル「ELYZA LLM for JP」シリーズの最新モデルとして、Meta社の「Llama 3」を基にした「Llama-3-ELYZA-JP-70B」(700億パラメータ)と「Llama-3-ELYZA-JP-8B」(80億パラメータ)を開発し、その性能を公開しました。
「Llama-3-ELYZA-JP-70B」は、Meta社の「Llama-3-70B」をベースに追加の学習(日本語追加事前学習・指示学習)を実施して開発されたモデルです。
「Llama-3-ELYZA-JP-70B」は、元モデルの「Llama-3-70B」から大きく日本語性能が向上しています。日本語の性能を測定するための2つのベンチマークを用いた自動評価において、国内モデルの中では最高性能の水準を実現。「GPT-4」や「Claude 3 Sonnet」、「Gemini 1.5 Flash」と同等、あるいは上回る性能を達成しています。
「Llama-3-ELYZA-JP-70B」は、安全なAPIサービスや共同開発プロジェクトなどを通して、様々な形態で、順次企業向けに提供が開始されます。
また、同時に発表された「Llama-3-ELYZA-JP-8B」は、Meta社の「Llama-3-8B」をベースに事後学習(日本語追加事前学習・指示学習)を実施して開発したモデルです。
「Llama-3-ELYZA-JP-70B」同様に、「Llama-3-ELYZA-JP-8B」も、元の「Llama-3-8B」から大きく日本語性能が向上しています。80億パラメータの軽量なモデルでありながら、日本語の性能を測定するための2つのベンチマークを用いた自動評価において、「GPT-3.5 Turbo」や「Claude 3 Haiku」、「Gemini 1.0 Pro」に匹敵する性能を達成しています。
ELYZAは、「Llama-3-ELYZA-JP-8B」モデルを一般公開します。本モデルはLLAMA 3 COMMUNITY LICENSEに準拠し、Acceptable Use Policyに従う限り、研究および商業目的での利用が可能です。
ELYZAは、これらのモデルの公開・提供を通じて、国内における LLM の社会実装の推進、並びにLLMの研究開発の発展を支援していく方針です。
出典:PR TIMES
The post ELYZA、最新日本語LLM「Llama-3-ELYZA-JP-70B」と「Llama-3-ELYZA-JP-8B」を公開。「GPT-4」を上回る性能を発揮 first appeared on AIポータルメディアAIsmiley.