Quantcast
Channel: LLM – AIポータルメディアAIsmiley
Viewing all articles
Browse latest Browse all 226

ELYZA、最新日本語LLM「Llama-3-ELYZA-JP-70B」と「Llama-3-ELYZA-JP-8B」を公開。「GPT-4」を上回る性能を発揮

$
0
0

ELYZAは、Meta社の「Llama 3」を基にした最新モデル「Llama-3-ELYZA-JP-70B」と「Llama-3-ELYZA-JP-8B」を開発し、その性能を公開しました。

このニュースのポイント

  • ELYZAが「ELYZA LLM for JP」シリーズの最新モデル「Llama-3-ELYZA-JP-70B」と「Llama-3-ELYZA-JP-8B」を公開
  • 70Bモデルは「GPT-4」や「Claude 3 Sonnet」を上回る性能で、企業向けに提供される予定
  • 8Bモデルは「GPT-3.5 turbo」を上回る性能で、研究や商業目的での利用が可能

株式会社ELYZAは、大規模言語モデル「ELYZA LLM for JP」シリーズの最新モデルとして、Meta社の「Llama 3」を基にした「Llama-3-ELYZA-JP-70B」(700億パラメータ)と「Llama-3-ELYZA-JP-8B」(80億パラメータ)を開発し、その性能を公開しました。

「Llama-3-ELYZA-JP-70B」は、Meta社の「Llama-3-70B」をベースに追加の学習(日本語追加事前学習・指示学習)を実施して開発されたモデルです。

「Llama-3-ELYZA-JP-70B」は、元モデルの「Llama-3-70B」から大きく日本語性能が向上しています。日本語の性能を測定するための2つのベンチマークを用いた自動評価において、国内モデルの中では最高性能の水準を実現。「GPT-4」や「Claude 3 Sonnet」、「Gemini 1.5 Flash」と同等、あるいは上回る性能を達成しています。

「Llama-3-ELYZA-JP-70B」は、安全なAPIサービスや共同開発プロジェクトなどを通して、様々な形態で、順次企業向けに提供が開始されます。

また、同時に発表された「Llama-3-ELYZA-JP-8B」は、Meta社の「Llama-3-8B」をベースに事後学習(日本語追加事前学習・指示学習)を実施して開発したモデルです。

「Llama-3-ELYZA-JP-70B」同様に、「Llama-3-ELYZA-JP-8B」も、元の「Llama-3-8B」から大きく日本語性能が向上しています。80億パラメータの軽量なモデルでありながら、日本語の性能を測定するための2つのベンチマークを用いた自動評価において、「GPT-3.5 Turbo」や「Claude 3 Haiku」、「Gemini 1.0 Pro」に匹敵する性能を達成しています。

ELYZAは、「Llama-3-ELYZA-JP-8B」モデルを一般公開します。本モデルはLLAMA 3 COMMUNITY LICENSEに準拠し、Acceptable Use Policyに従う限り、研究および商業目的での利用が可能です。

ELYZAは、これらのモデルの公開・提供を通じて、国内における LLM の社会実装の推進、並びにLLMの研究開発の発展を支援していく方針です。

出典:PR TIMES

The post ELYZA、最新日本語LLM「Llama-3-ELYZA-JP-70B」と「Llama-3-ELYZA-JP-8B」を公開。「GPT-4」を上回る性能を発揮 first appeared on AIポータルメディアAIsmiley.


Viewing all articles
Browse latest Browse all 226

Trending Articles