相次ぐ新LLM、調べ切れないので生成AIに聞きました

生成AIにLLMの説明や発表をしているサイトのURLを伝え、それぞれ説明してもらいました。
最新の情報を取得する必要があるので、主に「Bard」（Google）と「Bing」（Microsoft）に聞いています。
明らかにおかしい箇所は、省いたりしています。
質問の仕方を多少変えても修正がない場合、そのまま載せている箇所もあります。
自分の知識が追いつかないので、正確性に欠けているかもしれません。
生成AIでどこまでできるかの実験でもありますので、ご容赦ください。

LLMとは
GPTの進化の遷移
新登場のLLM
OpenCALM
1. OpenCALM（Bard生成）
2. OpenCALM（Bing生成）
Japanese StableLM Base Alpha 7B
1. Japanese StableLM Base Alpha 7B（Bard生成）
2. Japanese StableLM Base Alpha 7B（Bing生成）
Japanese StableLM Instruct Alpha 7B
1. Japanese StableLM Instruct Alpha 7B（Bard生成）
2. Japanese StableLM Instruct Alpha 7B（Bing生成）
3. 比較表（Bard生成）
4. 比較表（Bing生成）
汎用GPT言語モデル
1. 汎用GPT言語モデル（Bard生成）
2. 汎用GPT言語モデル（Bing生成）
対話GPT言語モデル
1. 対話GPT言語モデル（Bard生成）
2. 対話GPT言語モデル（Bing生成）
3. 比較表（Bard生成）
4. 比較表（Bing）
  1. HH-RLHF・SHP・FLAN
強化学習済み対話GPT言語モデル
1. 強化学習済み対話GPT言語モデル（Bard生成）
2. 強化学習済み対話GPT言語モデル（Bing生成）
PaLM 2
1. PaLM 2（Bard生成）
2. PaLM 2（Bing生成）
  1. Pathways
Med-PaLM 2
1. Med-PaLM 2（Bard生成）
2. Med-PaLM 2（Bing生成）
Sec-PaLM
1. Sec-PaLM（Bard生成）
2. Sec-PaLM（Bing生成）
Llama2
1. Llama2（Bard生成）
2. Llama2（Bing生成）
Llama2-hf
1. Llama2-hf（Bard生成）
2. Llama2-hf（Bing生成）
Llama2-chat
1. Llama2-chat（Bard生成）
2. Llama2-chat（Bing生成）
Llama2-chat-hf
1. Llama2-chat-hf（Bard生成）
2. Llama2-chat-hf（Bing生成）
汎用言語モデル
1. 汎用言語モデル（Bard生成）
2. 汎用言語モデル（Bing生成）
長期コンテキストモデル
1. 長期コンテキストモデル（Bard生成）
2. 長期コンテキストモデル（Bing生成）
対話言語モデル
1. 対話言語モデル（Bard生成）
2. 対話言語モデル（Bing生成）
画像対話モデル
1. 画像対話モデル（Bard生成）
2. 画像対話モデル（Bing生成）
Japanese StableLM Base Alpha 7B
1. Japanese StableLM Base Alpha 7B（Bard生成）
2. Japanese StableLM Base Alpha 7B（Bing生成）
Japanese StableLM Instruct Alpha 7B
1. Japanese StableLM Instruct Alpha 7B（Bard生成）
2. Japanese StableLM Instruct Alpha 7B（Bing生成）
Japanese InstructBLIP Alpha
1. Japanese InstructBLIP Alpha（Bard生成）
2. Japanese InstructBLIP Alpha（Bing生成）
  1. マルチモーダル
japanese large language model
1. japanese large language model（Bard生成）
2. japanese large language model（Bing生成）
japanese-large-lm-instruction-sft
1. japanese-large-lm-instruction-sft（Bard生成）
2. japanese-large-lm-instruction-sft（Bing生成）
Weblab-10B
1. Weblab-10B（Bard生成）
2. Weblab-10B（Bing生成）
Weblab-10B（事後学習済みモデル）
1. Weblab-10B（事後学習済みモデル）（Bard生成）
2. Weblab-10B（事後学習済みモデル）（Bing生成）
ELYZA-japanese-Llama-2-7b
1. ELYZA-japanese-Llama-2-7b（Bard生成）
2. ELYZA-japanese-Llama-2-7b（Bing生成）
ELYZA-japanese-Llama-2-7b-instruct
1. ELYZA-japanese-Llama-2-7b-instruct（Bard生成）
2. ELYZA-japanese-Llama-2-7b-instruct（Bing生成）
ELYZA-japanese-Llama-2-7b-fast
1. ELYZA-japanese-Llama-2-7b-fast（Bard生成）
2. ELYZA-japanese-Llama-2-7b-fast（Bing生成）
ELYZA-japanese-Llama-2-7b-fast-instruct
1. ELYZA-japanese-Llama-2-7b-fast-instruct（Bard生成）
2. ELYZA-japanese-Llama-2-7b-fast-instruct（Bing生成）
  1. ELYZA Tasks 100（Bard生成）
  2. ELYZA Tasks 100（Bing生成）
Codey
1. Codey（Bard生成）
2. Codey（Bing生成）
Code Llama
1. Code Llama（Bard生成）
2. Code Llama（Bing生成）
Code Llama Python
1. Code Llama Python（Bard生成）
2. Code Llama Python（Bing生成）
Code Llama Instruct
1. Code Llama Instruct（Bard生成）
2. Code Llama Instruct（Bing生成）
StableCode-Completion-Alpha-3B-4K
1. StableCode-Completion-Alpha-3B-4K（Bard生成）
2. StableCode-Completion-Alpha-3B-4K（Bing生成）
  1. Supervised Fine-TuningとInstruction Tuning（Bard生成）
  2. Supervised Fine-TuningとInstruction Tuning（Bing生成）
StableCode-Instruct-Alpha-3B
1. StableCode-Instruct-Alpha-3B（Bard生成）
2. StableCode-Instruct-Alpha-3B（Bing生成）
StableCode-Completion-Alpha-3B
1. StableCode-Completion-Alpha-3B（Bard生成）
2. StableCode-Completion-Alpha-3B（Bing生成）

LLMとは

LLMとは、大規模言語モデル（Large Language Model）の略です。
膨大な量のテキストデータでトレーニングされた言語モデルのことで、人間のようなテキストを生成したり、質問に答えたり、翻訳したりすることができるようになります。

LLMは、ディープラーニングと呼ばれる機械学習の技術を用いて構築されます。
ディープラーニングは、人間の脳の神経回路の働きを模倣した技術で、大量のデータを学習することで、人間に匹敵する性能を発揮することができます。

LLMは、さまざまな分野で活用されています。
例えば、チャットボットや検索エンジン、翻訳ツールなどに利用されています。
また、LLMは、まだ開発途上の技術ですが、今後はさらに進化していくことが期待されています。

LLMの特徴は、以下のとおりです。

膨大な量のテキストデータでトレーニングされる
人間のようなテキストを生成したり、質問に答えたり、翻訳したりできる
ディープラーニングと呼ばれる機械学習の技術を用いて構築される

LLMは、今後もさまざまな分野で活用されていく可能性を秘めた技術です。
（ここまでBardが生成）

言語モデル

言語モデルとは、単語列に対する確率分布であり、文章の途中まで与えられたときに次の単語を予測することができる技術です。
文章生成や機械翻訳などの自然言語処理のタスクに応用されます。
ニューラル言語モデルは深層ニューラルネットワークを用いており、数十億以上のパラメータを持つ巨大なモデルが開発されています。
GPTやBERTといったニューラル言語モデルは人間の言語能力に迫る性能を示しています。
しかし、言語モデルには倫理的や法的な問題も多く存在します。
例えば、偏見や差別的な表現を生成したり、著作権やプライバシーを侵害したりする可能性があります。
また、言語モデルの内部構造や動作原理は非常に複雑であり、その解釈性や信頼性を高めることも重要な課題です。
（ここまでBIngが生成）

GPTの進化の遷移

LLMの進化の過程を、OpenAIが開発したGPTシリーズについて整理すると、以下のようになります。

モデル	公開日	特徴（Bard生成）
GPT-1	2018年11月	1億1700万パラメータ、ブックコーパスの7,000冊を学習
GPT-2	2019年11月	15億パラメータ、ブックコーパスの1,500万冊を学習
GPT-3	2020年1月	LLMの進化において大きな転機となったモデル。パラメータ数は175億個で、GPT-2の10倍以上
InstructGPT	2022年1月	GPT-3に基づく強化学習モデル
GPT-3.5	2022年11月	GPT-3の10倍のパラメータ数、100倍のトレーニングデータ
GPT-4.0	2023年3月	GPT-3.5のさらに10倍のパラメータ数、1000倍のトレーニングデータ

Bard生成

モデル	より詳細の特徴（Bing生成）
GPT-1	GPT-1とは、OpenAIが2018年に発表した自然言語処理のモデルで、大規模なテキストデータを学習して自然言語の理解と生成を行うことができる言語モデルです。GPT-1は、Googleが2017年に発表したTransformerと呼ばれる機械学習モデルのデコーダ部分をベースにしたモデルで、BookCorpusと呼ばれる大規模なコーパスで事前学習されました。GPT-1は、教師なし学習で言語モデルを学習し、教師あり学習でタスクに対応する目的関数によってファインチューニングを行うことで、さまざまな自然言語処理タスクに対応できる汎用性と柔軟性を持ちます。GPT-1のパラメータ数は約1.17億個で、当時最大級の言語モデルでした。
GPT-2	GPT-2は、2019年2月にOpenAIによって発表された自然言語処理のモデルで、大規模なテキストデータを学習して自然言語の理解と生成を行うことができます。GPT-2は、1,500億個のパラメータを持ち、当時最大級の言語モデルでした。しかし、GPT-2は、学習したデータに含まれる偏見や誤情報を反映したり、人間にとって有害な出力を生成したりする可能性があるとして、一部のモデルの公開が制限されました。
GPT-3	GPT-3は、2020年5月にOpenAIによって発表された自然言語処理のモデルで、GPT-2の後継モデルです。GPT-3は、1,750億個のパラメータを持ち、GPT-2よりも約10倍大きい言語モデルです。GPT-3は、さまざまなタスクに対応できる汎用性と柔軟性を持ち、文章生成だけでなく、質問応答や要約、翻訳なども行うことができます2。しかし、GPT-3もまた、学習したデータに依存した出力を行うため、偏見や不正確さが生じることが指摘されました。
InstructGPT	InstructGPTは、2021年12月にOpenAIによって発表された自然言語処理のモデルで、GPT-3の改良版です。InstructGPTは、人間のフィードバックを基にした強化学習を用いて、ユーザーの指示に従って有用で無害な出力を行うことができるように訓練されています。InstructGPTは、3,550億個のパラメータを持ち、GPT-3よりも約2倍大きい言語モデルです。InstructGPTは、人間の評価においてもGPT-3よりも高い品質と信頼性を示しました。
GPT-3.5	GPT-3.5は、2022年6月にOpenAIによって発表された自然言語処理のモデルで、InstructGPTの中間版です。GPT-3.5は、7,000億個のパラメータを持ち、InstructGPTよりも約2倍大きい言語モデルです。GPT-3.5は、InstructGPTと同様に人間のフィードバックを反映させた強化学習を用いていますが、さらに多様なドメインやタスクに対応できるように拡張されています。
GPT-4.0	GPT-4は、2023年3月にOpenAIによって発表された自然言語処理のモデルで、InstructGPTの最終版です。GPT-4は、14,000億個のパラメータを持ち、GPT-3.5よりも約2倍大きい言語モデルです。GPT-4は、InstructGPTやGPT-3.5と同様に人間のフィードバックを反映させた強化学習を用いていますが、さらに視覚的な入力や長い文脈も扱えるようになっています。GPT-4は、創造性や協調性も高められており、文章生成だけでなく、画像生成やプログラミング補助なども行うことができます6。

Bing生成

GPT-1は、OpenAIが初めて発表したLLMです。
GPT-2では、パラメータ数と学習データ量が大幅に増加し、生成されるテキストの質が向上しました。InstructGPTでは、人間のフィードバックによる強化学習により、GPT-3の生成されるテキストの自然さが向上しました。GPT-3.5では、GPT-3のパラメータ数とトレーニングデータ量がさらに増加し、生成されるテキストの質がさらに向上しました。GPT-4.0では、GPT-3.5のパラメータ数とトレーニングデータ量がさらに増加し、生成されるテキストの質がさらに向上しました。

GPTシリーズの進化において、主な進化ポイントは、以下のとおりです。

パラメータ数とトレーニングデータ量の増加
強化学習の活用
アーキテクチャの改善

パラメータ数とトレーニングデータ量の増加は、LLMの性能を向上させるための最も重要な要素です。強化学習の活用は、GPT-3の生成されるテキストの自然さを向上させるために有効であることが実証されました。アーキテクチャの改善は、GPT-4.0の性能向上に貢献しました。

LLMは、今後もさまざまな分野で活用されていく可能性を秘めた技術です。今後も、LLMの進化が期待されます。
（ここまでBardが生成）

強化学習

nstructGPTの訓練には、通常の教師あり学習に加えて、強化学習も使用されました。
この強化学習は、モデルを特定のタスクに対してより適切に調整し、ユーザーの指示に従ったより適切な応答を生成するのに役立ちます。

InstructGPTにおける強化学習の一般的なプロセスは以下の通りです：

教師あり学習（Supervised Learning）: 最初に、大規模なデータセットを使用して、モデルを特定のタスクに対して教育します。例えば、テキスト生成のタスクであれば、モデルに対して正しい応答が提供され、それを学習させます。
データ収集と強化学習の設計: 次に、ユーザーからのフィードバックを収集し、InstructGPTの出力の品質を向上させるための強化学習の設計が行われます。ユーザーからの指示に従ったテキスト生成がどれだけ適切かを評価するための報酬関数が設計されます。
強化学習: 設計された報酬関数を使用して、モデルを調整します。モデルは、ユーザーの指示に従ったより良い応答を生成するために、強化学習を通じて自己改善します。報酬関数に基づいて、モデルが生成した応答の品質を評価し、報酬を最大化するように学習します。
反復: 強化学習のプロセスは反復的に行われ、モデルが適切なレベルに収束するまで繰り返されます。

このプロセスにより、InstructGPTは特定のタスクにおいてユーザーの指示に従うより優れた能力を獲得し、より適切な回答や応答を生成できるようになります。
強化学習は、ユーザーエクスペリエンスの向上と、モデルの適用範囲の拡大に寄与します。
（ここまでChatGPT3.5が生成）

新登場のLLM

OpenCALM

OpenCALM（Bard生成）

サイバーエージェントが開発した日本語特化型のLLM（大規模言語モデル）であるOpenCALMは、68億のパラメータで学習されています。これにより、自然な日本語の文章生成、言語翻訳、質問応答など、さまざまなタスクで高いパフォーマンスを実現しています。

OpenCALMは、日本語特化型のLLMであるため、日本語の表現やニュアンスなどを正確に理解・生成することができます。そのため、コンテンツ生成やコミュニケーションなど、日本語を活用するさまざまな用途に適しています。

OpenCALMの特徴は、以下の3つです。

68億のパラメータで学習されており、自然な日本語の文章生成、言語翻訳、質問応答など、さまざまなタスクで高いパフォーマンスを実現
日本語特化型のLLMであり、日本語の表現やニュアンスなどを正確に理解・生成することができる
オープンソースで公開されており、誰でも利用することができる

OpenCALM（Bing生成）

OpenCALMとは、サイバーエージェントが公開した日本語の大規模言語モデルです。大規模言語モデルとは、大量のテキストデータを学習して、自然言語の理解や生成を行うことができる人工知能の技術です。

OpenCALMは、パラメータ数が最大で68億個にもなり、複雑な処理ができます。OpenCALMは、対話型AIや文章生成などの応用に向いており、商用利用も可能です。今後は、さらにパラメータ数を増やして高精度化を目指しています。

OpenCALMの特徴は、以下のとおりです。

オープンなデータで学習されている
CC BY-SA 4.0というライセンスで公開されている
チューニングを行うことでさまざまなタスクに対応できる

¹: サイバーエージェント、日本語LLM「OpenCALM」を一般公開

Japanese StableLM Base Alpha 7B

Japanese StableLM Base Alpha 7B（Bard生成）

Stability AIが開発した日本語向けのLLM（大規模言語モデル）であるJapanese StableLM Base Alpha 7Bは、70億のパラメータで学習されています。これにより、自然な日本語の文章生成、言語翻訳、質問応答など、さまざまなタスクで高いパフォーマンスを実現しています。

Japanese StableLM Base Alpha 7Bは、日本語の表現やニュアンスなどを正確に理解・生成することができます。そのため、コンテンツ生成やコミュニケーションなど、日本語を活用するさまざまな用途に適しています。

今後、Japanese StableLM Base Alpha 7Bは、商用利用可能なライセンスで提供される予定です。また、指示応答機能や、より高度な日本語表現を生成できる機能などの追加開発も計画されています。

Japanese StableLM Base Alpha 7Bの特徴は、以下の3つです。

70億のパラメータで学習されており、自然な日本語の文章生成、言語翻訳、質問応答など、さまざまなタスクで高いパフォーマンスを実現
日本語特化型のLLMであり、日本語の表現やニュアンスなどを正確に理解・生成することができる
商用利用可能なライセンスで提供される予定があり、さまざまな用途で活用されることが期待されている

Japanese StableLM Base Alpha 7B（Bing生成）

Japanese StableLM Base Alpha 7Bとは、Stability AI Japanが開発した日本語の大規模言語モデルです。大規模言語モデルとは、大量のテキストデータを学習して、自然言語の理解や生成を行うことができる人工知能の技術です。

Japanese StableLM Base Alpha 7Bは、70億個のパラメータを持ち、ウェブを中心とした主に日本語と英語のテキストデータ（内2％はソースコード）のべ7500億トークンを用いてテキスト生成を学習しました¹ 。

Japanese StableLM Base Alpha 7Bは、文章生成や要約、翻訳などのタスクに対応でき、商用利用も可能です² 。

今後は、さらにパラメータ数を増やして高精度化を目指しています³。

Japanese StableLM Base Alpha 7Bの特徴は、以下のとおりです。

オープンなデータで学習されている
Apache License 2.0というライセンスで公開されている
チューニングを行うことでさまざまなタスクに対応できる

Japanese StableLM Instruct Alpha 7B

Japanese StableLM Instruct Alpha 7B（Bard生成）

Stability AIが開発した日本語向けのLLM（大規模言語モデル）であるJapanese StableLM Instruct Alpha 7Bは、70億のパラメータで学習されています。これは、同社の日本語向けLLMであるJapanese StableLM Base Alpha 7Bと同じパラメータ数です。

両者の違いは、指示応答機能です。Japanese StableLM Instruct Alpha 7Bは、ユーザーの指示に応答して、テキストを生成したり、翻訳したり、質問に答えたりすることができます。一方、Japanese StableLM Base Alpha 7Bは、指示応答機能がなく、テキスト生成、翻訳、質問応答などのタスクを、ユーザーが自由に指定して実行する必要があります。

そのため、Japanese StableLM Instruct Alpha 7Bは、ユーザーとの対話型のアプリケーションや、特定の目的のためのアプリケーションに向いています。例えば、チャットボットや、翻訳アプリ、質問応答システムなどに活用することができます。

Japanese StableLM Instruct Alpha 7Bの特徴は、以下の3つです。

70億のパラメータで学習されており、自然な日本語の文章生成、言語翻訳、質問応答など、さまざまなタスクで高いパフォーマンスを実現
日本語特化型のLLMであり、日本語の表現やニュアンスなどを正確に理解・生成することができる
指示応答機能があり、ユーザーの指示に応じて、テキストを生成したり、翻訳したり、質問に答えたりすることができる

Japanese StableLM Instruct Alpha 7B（Bing生成）

Japanese StableLM Instruct Alpha 7Bとは、Stability AI Japanが開発した日本語の大規模言語モデルです。

Japanese StableLM Instruct Alpha 7Bは、Japanese StableLM Base Alpha 7Bの改良版で、70億個のパラメータを持ちます。

Japanese StableLM Instruct Alpha 7Bは、人間の指示に従って有用で無害な出力を行うことができるように訓練されており、文章生成だけでなく、対話やプログラミングなどのタスクに対応できます。

今後は、さらにパラメータ数を増やして高精度化を目指しています。

Japanese StableLM Instruct Alpha 7Bの特徴は、以下のとおりです。

Japanese StableLM Base Alpha 7Bをベースにしている
人間のフィードバックを反映させた強化学習を用いている
チューニングを行うことでさまざまなタスクに対応できる

: [日本語大規模言語モデル「Japanese StableLM」を公開しました]

以下の表に、指定された情報を反映しました。

比較表（Bard生成）

項目	Japanese StableLM Base Alpha 7B	Japanese StableLM Instruct Alpha 7B
モデルサイズ	70億パラメータ	70億パラメータ
学習データ	主に日本語と英語で構成されたテキストテキスト	主に日本語と英語で構成されたテキスト + インストラクション文
事後学習	なし	あり
適性	自然な日本語の生成	自然な日本語の生成 + ユーザーの指示への受け答え
事後学習の内容	なし	Supervised Fine-tuning (SFT)
自然な日本語の生成機能	テキストのみを学習データに含むため、プログラミングや技術に関する文書の生成に不向き	テキストに加えて、インストラクション文も学習データに含むため、プログラミングや技術に関する文書の生成にも適している

比較表（Bing生成）

項目	Japanese StableLM base Alpha 7B	Japanese StableLM Instruct Alpha 7B
パラメータ数	70億	70億
学習データ	ウェブの大規模データ（主に日本語と英語、ソースコードが約2%）	テキストとインストラクション文の両方を含むオープンデータセット
学習トークン数	7500億	不明
ライセンス	Apache License 2.0（商用利用可能）	研究目的での利用に限定
特徴	汎用的なテキスト生成モデル	ユーザーの指示に従ってテキストを生成するモデル

汎用GPT言語モデル

汎用GPT言語モデル（Bard生成）

rinna 汎用GPT言語モデルは、rinna株式会社が開発した日本語特化型のLLM（大規模言語モデル）です。2023年5月に公開されました。

rinna 汎用GPT言語モデルは、36億のパラメータで学習されており、自然な日本語の文章生成、言語翻訳、質問応答など、さまざまなタスクで高いパフォーマンスを実現しています。

rinna 汎用GPT言語モデルは、日本語特化型のLLMであるため、日本語の表現やニュアンスなどを正確に理解・生成することができます。そのため、コンテンツ生成やコミュニケーションなど、日本語を活用するさまざまな用途に適しています。

今後、rinna 汎用GPT言語モデルは、オープンソースとしてさらに開発を進め、より多くのユーザーに利用できるようにしていく予定です。

rinna 汎用GPT言語モデルの特徴は、以下の3つです。

36億のパラメータで学習されており、自然な日本語の文章生成、言語翻訳、質問応答など、さまざまなタスクで高いパフォーマンスを実現
日本語特化型のLLMであり、日本語の表現やニュアンスなどを正確に理解・生成することができる
オープンソースで公開されており、誰でも利用することができる

汎用GPT言語モデル（Bing生成）

rinna 汎用GPT言語モデルとは、株式会社rinnaが開発した日本語の大規模言語モデルです。

rinnaのミッションは、「AIの民主化」であり、誰もが気軽にAIを使える世界を目指しています。そのため、rinna 汎用GPT言語モデルは、商用利用も可能なライセンスで公開されており、さまざまなアプリケーションやサービスに組み込むことができます。

rinna 汎用GPT言語モデルは、日本語に特化した大規模なデータで学習されており、文章生成や対話などのタスクに対応できます。今後は、さらにパラメータ数を増やして高精度化を目指しています。

rinna 汎用GPT言語モデルの特徴は、以下のとおりです。

AIの民主化を目指している
商用利用も可能なライセンスで公開されている
チューニングを行うことでさまざまなタスクに対応できる

: [株式会社rinna、日本語最大級の汎用GPT言語モデル「rinna 汎用GPT言語モデル」を公開]

対話GPT言語モデル

対話GPT言語モデル（Bard生成）

rinna 対話GPT言語モデルは、rinna株式会社が開発した日本語特化型のLLM（大規模言語モデル）です。2023年5月に公開されました。

rinna 対話GPT言語モデルは、36億のパラメータで学習されており、自然な日本語の文章生成、言語翻訳、質問応答など、さまざまなタスクで高いパフォーマンスを実現しています。

rinna 対話GPT言語モデルは、汎用GPT言語モデルと同様、日本語特化型のLLMであるため、日本語の表現やニュアンスなどを正確に理解・生成することができます。しかし、汎用GPT言語モデルとは異なり、人間の評価を利用した強化学習（Reinforcement Learning from Human Feedback; RLHF）によって学習されています。

そのため、rinna 対話GPT言語モデルは、対話形式のテキスト生成において、汎用GPT言語モデルよりも高いパフォーマンスを実現しています。

rinna 対話GPT言語モデルの特徴は、以下の3つです。

36億のパラメータで学習されており、自然な日本語の文章生成、言語翻訳、質問応答など、さまざまなタスクで高いパフォーマンスを実現
日本語特化型のLLMであり、日本語の表現やニュアンスなどを正確に理解・生成することができる
人間の評価を利用した強化学習によって学習されており、対話形式のテキスト生成において高いパフォーマンスを実現

rinna 対話GPT言語モデルは、対話型のアプリケーションや、特定の目的のためのアプリケーションに向いています。例えば、チャットボットや、翻訳アプリ、質問応答システムなどに活用することができます。

対話GPT言語モデル（Bing生成）

rinna 対話GPT言語モデルとは、株式会社rinnaが開発した日本語の大規模言語モデルです。

rinna 対話GPT言語モデルは、rinna 汎用GPT言語モデルの派生版で、36億個のパラメータを持ちます。

rinna 対話GPT言語モデルは、対話に特化したデータで学習されており、人間と自然な会話を行うことができます。今後は、さらにパラメータ数を増やして高精度化を目指しています。

rinna 対話GPT言語モデルの特徴は、以下のとおりです。

rinna 汎用GPT言語モデルをベースにしている
対話に特化した大規模なデータで学習されている
人間と自然な会話を行うことができる
HH-RLHF・SHP・FLAN の一部を日本語に翻訳したデータを用いて学習されている
対話形式のインターフェースを採用している

rinna 対話GPT言語モデルのライセンスは、MITライセンスです¹。これは、商用利用可能なライセンスであり、オープンソースのモデルを自由に利用・改変・再配布することができます²。ただし、MITライセンスのコピーを添付する必要があります²。

rinna、日本語に特化した36億パラメータのGPT言語モデルを公開

比較表（Bard生成）

かしこまりました。以下の表に、rinnaの汎用GPT言語モデルと対話GPT言語モデルの比較をまとめました。

項目	汎用GPT言語モデル	汎用GPT言語モデル
モデルサイズ	36億パラメータ	36億パラメータ
学習データ	日本語のニュース記事、ブログ記事、小説、Webページなど	日本語のニュース記事、ブログ記事、小説、Webページ、対話データ
事後学習	なし	あり
適性	自然な日本語の生成、テキストの要約、翻訳、創作など	自然な日本語の生成、テキストの要約、翻訳、創作、対話など
特徴	さまざまなジャンルのテキストで構成された学習データを使用して学習されているため、自然な日本語の生成やテキストの要約、翻訳、創作など、さまざまなタスクに適している	対話データを事後学習データに含んでいるため、対話にも適している。汎用GPT言語モデルよりも対話に適している

比較表（Bing）

項目	汎用GPT言語モデル	対話GPT言語モデル
パラメータ数	36億	36億
学習データ	日本語のWikipedia、C4、CC-100	汎用GPT言語モデルに対して対話形式のデータでfine-tuning
学習方法	自己教師あり学習	fine-tuningと強化学習
テキスト生成性能	perplexity 8.68	人間の評価に基づく報酬モデルのスコアを利用
入力形式	任意のテキスト	対話形式のテキスト
出力形式	任意のテキスト	対話形式のテキスト
利用目的	テキスト生成や分析などの汎用的なタスク	ユーザーの指示を遂行する対話的なタスク

HH-RLHF・SHP・FLAN

「HH-RLHF・SHP・FLAN」とは、英語の大規模言語モデルであるGPT-3を用いて作成された対話データセットのことです。それぞれ、以下のような意味を持ちます。

HH-RLHF：Human-Human Reddit Large Humor-Focusedというデータセットで、Redditというウェブサイトのユーザー同士の面白い会話を集めたものです。
SHP：Sarcasm, Humor and Personalityというデータセットで、さまざまなジャンルのテキストに対して、皮肉やユーモアや個性を表現するような返答を生成したものです。
FLAN：Fictional Language ANnotationというデータセットで、架空の言語や方言を使って会話するキャラクターを想定したものです。

これらのデータセットは、人間と自然で楽しい会話を行うことができる対話言語モデルを作るために利用されています。
（ここまでBiingが生成）

強化学習済み対話GPT言語モデル

強化学習済み対話GPT言語モデル（Bard生成）

rinna 強化学習済み対話GPT言語モデルは、36億のパラメータで学習されており、自然な日本語の文章生成、言語翻訳、質問応答など、さまざまなタスクで高いパフォーマンスを実現しています。

rinna 強化学習済み対話GPT言語モデルは、rinna 対話GPT言語モデルと同様、日本語特化型のLLMであり、日本語の表現やニュアンスなどを正確に理解・生成することができます。

rinna 強化学習済み対話GPT言語モデルは、rinna 対話GPT言語モデルよりも多くの学習データで強化学習されており、対話形式のテキスト生成において、より高いパフォーマンスを実現しています。

rinna 強化学習済み対話GPT言語モデルの特徴は、以下の3つです。

36億のパラメータで学習されており、自然な日本語の文章生成、言語翻訳、質問応答など、さまざまなタスクで高いパフォーマンスを実現
日本語特化型のLLMであり、日本語の表現やニュアンスなどを正確に理解・生成することができる
大量の学習データで強化学習されており、対話形式のテキスト生成において高いパフォーマンスを実現

rinna 対話GPT言語モデルとの違いは、学習データの規模と、強化学習に用いるデータです。rinna 強化学習済み対話GPT言語モデルは、rinna 対話GPT言語モデルよりも多くの学習データで強化学習されており、対話形式のテキスト生成において、より高いパフォーマンスを実現しています。また、rinna 強化学習済み対話GPT言語モデルは、強化学習に、英語で公開されているHH-RLHFの一部を日本語に翻訳したデータを用いています。

強化学習済み対話GPT言語モデル（Bing生成）

rinna 強化学習済み対話GPT言語モデルとは、株式会社rinnaが開発した日本語の大規模言語モデルです。

rinna 強化学習済み対話GPT言語モデルは、rinna 対話GPT言語モデルの改良版で、36億個のパラメータを持ちます。

rinna 強化学習済み対話GPT言語モデルは、人間の評価を基にした強化学習を用いて、人間とより自然で楽しい会話を行うことができるように訓練されています。強化学習には、HH-RLHFの一部を日本語に翻訳したデータを用いています。今後は、さらにパラメータ数を増やして高精度化を目指しています。

rinna 強化学習済み対話GPT言語モデルは、Hugging Faceに商用利用可能なMIT Licenseで公開されており、Hugging Face Hubからダウンロードできます。

rinna 強化学習済み対話GPT言語モデルの特徴は、以下のとおりです。

rinna 対話GPT言語モデルをベースにしている
人間の評価を反映させた強化学習を用いている
人間と自然で楽しい会話を行うことができる
Hugging Faceに商用利用可能なMIT Licenseで公開されている
Hugging Face Hubからダウンロードできる

: [株式会社rinna、日本語最大級の強化学習済み対話GPT言語モデル「rinna 強化学習済み対話GPT言語モデル」を公開]

PaLM 2

PaLM 2（Bard生成）

Google AIが開発した大規模言語モデル（LLM）であるPaLM2は、2023年7月20日に発表されました。PaLM2は、1.56兆のパラメータで学習されており、自然言語処理（NLP）タスクにおいて、人間の水準に近いパフォーマンスを実現しています。

PaLM2は、テキスト生成、翻訳、質問応答、コード生成、ドキュメント要約など、さまざまなNLPタスクに適用することができます。特に、以下のような用途に向いていると考えられます。

自然な会話の生成
創造的なコンテンツの生成
自然言語の翻訳
複雑な質問への回答
ソフトウェアコードの生成

PaLM2は、今後もさらなる開発が進められることが予定されています。具体的には、以下のような機能の向上が期待されています。

より自然で人間らしいテキストの生成
より幅広いタスクへの対応
より高速な処理

PaLM2の特徴は、以下の3つです。

1.56兆のパラメータで学習されており、自然言語処理タスクにおいて、人間の水準に近いパフォーマンスを実現
テキスト生成、翻訳、質問応答、コード生成、ドキュメント要約など、さまざまなNLPタスクに適用可能
今後もさらなる開発が進められることで、さらに高度な機能を備えるようになる

PaLM 2（Bing生成）

PaLM2は、Googleが2023年5月に発表した次世代の大規模言語モデルです¹ 。PaLM2は、PaLMの研究を発展させ、多言語や推論、およびコーディングの性能を向上させました² 。

PaLM2は、最大1,000兆個のパラメーターを持ち¹ 、GPT-3やPaLMよりも高い精度を示しました³ 。PaLM2は、複雑なタスクを単純なサブタスクに分解したり、曖昧な言葉の意味を理解したりすることができます¹。PaLM2は、多言語翻訳やプログラミングコードの生成など、幅広い用途に適しています¹。PaLM2は、Googleの製品やサービスに活用される予定であり¹ 、Med-PaLM 2やSec-PaLMといった他の先進的なモデルにも応用されています¹。

PaLM2の特徴は以下のとおりです。

1,000兆個のパラメーターを持つ大規模言語モデル
多言語や推論、コーディングなどの高度なタスクに優れる
Pathwaysという新しい学習アプローチにより効率的に学習する

Med-PaLM 2やSec-PaLMとは、Googleが開発した大規模言語モデル（LLM）です。それぞれの特徴は以下のとおりです。

Med-PaLM 2は、医療分野に特化したLLMで、医学的な質問に高精度で回答できます¹ 。Med-PaLM 2は、米国医師資格試験（USMLE）やインドのAIIMSやNEETなどの医学試験において、専門家レベルの成績を達成しました²。
Sec-PaLMは、セキュリティ分野に特化したLLMで、ソフトウェアの脆弱性やマルウェア、脅威指標などのセキュリティ情報を理解し、セキュリティ問題を解決するのに役立ちます³ 。Sec-PaLMは、Google Cloud Security AI Workbenchというセキュリティスイートの中核を担っています⁴。

Pathways

Pathwaysは、Google AIが開発した新しいTransformerアーキテクチャです。Pathwaysは、Transformerの各層を、さまざまなタスクに特化した複数のパス（通路）に分割することで、効率的な学習と推論を可能にします。

PaLM2は、Pathwaysアーキテクチャを採用することで、従来のTransformerモデルよりもはるかに多くのパラメータを学習することができます。また、Pathwaysアーキテクチャは、さまざまなタスクに適応しやすいため、PaLM2は、テキスト生成、翻訳、質問応答、コード生成、ドキュメント要約など、さまざまなNLPタスクで高いパフォーマンスを実現しています。
（ここまでBardが生成）

Med-PaLM 2

Med-PaLM 2（Bard生成）

Med-PaLM 2は、Google AIが開発した医療分野に特化した大規模言語モデル（LLM）です。2023年6月29日に発表されました。

（実際には3月発表）

Med-PaLM 2は、医療文献や医療データセットなどの膨大なデータセットで学習されており、医療に関する幅広いタスクに使用できます。具体的には、

医学用語の翻訳
医学論文の要約
医療質問への回答
医療画像の診断

などに使用できます。

Med-PaLM 2の特徴は、以下のとおりです。

医療分野に特化：Med-PaLM 2は、医療分野に特化したデータセットで学習されているため、医療に関するタスクに高い精度で対応できる

Med-PaLM 2は、まだ開発中ですが、医療分野における自然言語処理の可能性を大きく広げるモデルとして期待されています。

PaLM 2との違いは、以下のとおりです。

学習データ：Med-PaLM 2は医療分野に特化したデータセットで学習されている
タスク：Med-PaLM 2は医療に関するタスクに特化している

PaLM 2は、医療分野に特化したデータセットで学習されていません。また、PaLM 2は、医療に関するタスクに特化されていません。

Med-PaLM 2（Bing生成）

Med-PaLM 2は、Googleが開発した医療分野に特化した大規模言語モデル（LLM）です。

医学的な質問に高精度で回答できるように設計されました。Med-PaLM 2は、医学的な知識や推論を理解し、診断や治療の提案などを行うことができます。Med-PaLM 2は、医師や患者などの医療関係者に役立つ用途に適しています。

Med-PaLM 2は、PaLM 2を医療分野に特化したデータでファインチューニングしたもので、医学的な質問に対する回答や健康データの整理などに優れています。¹ ² PaLM 2は、多言語、推論、コーディングなどのさまざまなタスクに対応できる大規模言語モデルです。³

つまり、Med-PaLM 2は以下の3つの特徴を持つモデルです。

医療分野に特化した性能や機能を持つ
医学的な質問に高精度で回答することができる
Googleが開発した最新世代の大規模言語モデル

Med-PaLM 2はテキストだけでなく、画像や音声も扱えるようになりました。¹ ²

これは、医療分野でさまざまなデータ形式を解釈する必要があることを考えると、非常に便利な機能です。例えば、マンモグラフィーや皮膚科の画像を解釈したり、放射線画像検査の報告を生成したり、要約したりすることができます。³

また、Med-PaLM Mという最新のモデルでは、ゲノムデータも扱えるようになりました。³

Sec-PaLM

Sec-PaLM（Bard生成）

Sec-PaLMは、Google AIが開発したセキュリティ分野に特化した大規模言語モデル（LLM）です。2023年7月20日に発表されました。

（実際には2023年4月発表）

Sec-PaLMは、セキュリティに関するテキストやコードなどの膨大なデータセットで学習されており、セキュリティに関する幅広いタスクに使用できます。具体的には、

セキュリティに関するテキストの生成
セキュリティに関するコードの生成
セキュリティに関する脅威の検出
セキュリティに関する対策の提案

などに使用できます。

Sec-PaLMの3つの特徴は、以下のとおりです。

セキュリティ分野に特化：Sec-PaLMは、セキュリティに関するデータセットで学習されているため、セキュリティに関するタスクに高い精度で対応できる
生成能力：Sec-PaLMは、セキュリティに関するテキストやコードを生成できるため、セキュリティの専門家が行う作業を効率化できる
脅威検出：Sec-PaLMは、セキュリティに関する脅威を検出できるため、セキュリティのリスクを低減できる

Sec-PaLM（Bing生成）

Sec-PaLMとは、セキュリティ分野に特化したPaLM 2の派生モデルです。¹ PaLM 2は、5400億個のパラメータを持つ大規模言語モデルで、テキストやコードの生成や理解ができます。²

ソフトウェアの脆弱性、マルウェア、脅威指標、攻撃者のプロファイルなどのセキュリティ関連のインテリジェンスを組み込んで微調整されています。

Sec-PaLMは、PaLM 2のパラメータ数を約半分に減らし、セキュリティ関連のデータでファインチューニングしました。¹ これにより、Sec-PaLMは、セキュリティの脅威や攻撃を検出したり、防御策を提案したりする能力を持ちます。¹

Sec-PaLMは、セキュリティAIワークベンチというプラットフォームで利用できます。¹ このプラットフォームでは、Sec-PaLMを使って、セキュリティシナリオを生成したり、シミュレーションしたりすることができます。¹

Sec-PaLMの特徴を3つコンパクトにまとめると、以下のようになります。

セキュリティ分野に特化した大規模言語モデルです。
セキュリティの脅威や攻撃を検出したり、防御策を提案したりする能力を持ちます。
Google Cloud Security AI Workbenchというプラットフォームで利用できます。

Llama2

Llama2（Bard生成）

Meta AIが開発した大規模言語モデル（LLM）であるLlama2は、2023年7月18日に発表されました。Llama2は、700億のパラメータで学習されており、自然言語処理（NLP）タスクにおいて、人間の水準に近いパフォーマンスを実現しています。

Llama2は、テキスト生成、翻訳、質問応答、コード生成、ドキュメント要約など、さまざまなNLPタスクに適用することができます。特に、以下のような用途に向いていると考えられます。

テキストの自動生成（ニュース記事、ブログ記事、広告など）
言語の翻訳
複雑な質問への回答
ソフトウェアコードの生成
ドキュメントの要約

Llama2は、商用利用も可能な無償のオープンソースです。
Meta AIは、Llama2の商用利用を許可しており、企業や研究機関は、Llama2を商用目的で利用することができます。

Llama2は、大規模言語モデルの商用利用の可能性を広げるモデルとして注目されています。無償のオープンソースであることにより、企業や研究機関は、Llama2を活用し、新たなビジネスやサービスの創出に貢献することが期待されています。

ただし、Llama2を商用利用する際には、Meta社に使用報告を提出する必要があります。これは、Meta社がLlama2の品質や安全性を向上させるためです。また、Llama2を商用利用する際には、MicrosoftのAzure Machine Learningを使用する必要があります。

Llama2の特徴は、以下の3つです。

700億のパラメータで学習されており、自然言語処理タスクにおいて、人間の水準に近いパフォーマンスを実現
テキスト生成、翻訳、質問応答、コード生成、ドキュメント要約など、さまざまなNLPタスクに適用可能
Meta AIのオープンソースプロジェクトとして、誰でも利用可能（商用利用も可能、ライセンスは有償）

Llama2は、NLPの技術革新に大きく貢献する可能性を秘めたモデルです。今後の開発に期待が高まります。

Llama2（Bing生成）

Llama2は、Metaが開発した次世代の大規模言語モデル（LLM）です¹。

Llama2は、公開されているオンラインデータソースで事前トレーニングされました¹。Llama2には、パラメーター数が異なる3つのバリエーションがあります。7B、13B、70Bの3種類です¹。

パラメーター数が多いほど、モデルの精度が高くなります¹。Llama2は、自然言語処理（NLP）や生成AI（GAI）などの高度なタスクに適しています¹ 。

Llama2は、Azure AIのモデルカタログで利用可能であり¹、Microsoftの製品やサービスに活用される予定です¹。

Llama2の特徴は以下のとおりです。

パラメーター数が最大70Bという大規模言語モデル
オンラインデータソースで事前トレーニングされた汎用性の高いモデル
商用利用と研究の両方を目的としたオープンなモデル

Llama2は、無償での商用ライセンスを提供する大規模言語モデルです¹ ² 。

Llama2は、オープンソースであり、研究やビジネスの両方に利用できます¹ ² 。Llama2は、MetaとMicrosoftが共同開発したモデルであり、Azure AIのモデルカタログで利用可能です¹ ² 。

また、チャット用に最適化されたLlama2-Chatというモデルもあります¹。

（Llama2のパラメータ数はChatGPT３.5より少ないですね。と質問）

はい、Llama2のパラメータ数はChatGPT3.5より少ないです。Llama2の最大パラメータ数は70Bですが、ChatGPT3.5の最大パラメータ数は355Bです¹ 。

しかし、パラメータ数だけではモデルの性能を判断できません。Llama2は、オンラインデータソースで事前トレーニングされた汎用性の高いモデルであり、多言語翻訳やプログラミングコードの生成など、幅広い用途に適しています² 。

ChatGPT3.5は、会話型AIに特化したモデルであり、自然な会話や創造的な応答を生成することができます³。両者は、それぞれ異なる目的や強みを持っています。

Llama2-hf

Llama2-hf（Bard生成）

（回答に一貫性がなかったので一部抜粋）

Llama2-hfは、Llama2と同一のパラメータ数と学習データセットを使用しています。そのため、Llama2-hfは、Llama2と同様のパラメータ数と学習データセットでトレーニングされており、Llama2と同等の精度と汎用性を実現しています。

Llama2-hfがLlama2よりも高い精度と汎用性を実現しているのは、Transformersライブラリの機能によるものです。Transformersライブラリは、Llama2をより簡単に使用できるようにするためのライブラリであり、Llama2-hfは、Transformersライブラリの機能を利用して、Llama2よりも高い精度と汎用性を実現しています。

Llama2-hfは、Hugging Face社がLlama2のソースコードや学習済みパラメータを入手して、Transformersライブラリで利用できるようにしたものになります。

したがって、Llama2-hfと通常のLlama2との主な違いは、提供元、ライセンス、フレームワーク、入手方法の4つになります。

Llama2-hf（Bing生成）

（回答に一貫性がなかったので一部抜粋）

Llama2-hfは、Llama2のHugging Face版です。Llama2には、パラメーター数が異なる3つのバリエーションがあります。7B、13B、70Bの3種類です。Llama2-hfは、これらのモデルをHugging FaceのTransformersライブラリで利用できるようにしたものです。

Llama2-hfと通常のLlama2との違いは以下のとおりです。

Llama2-hfは、Hugging Face社が提供するものです。
Llama2-hfは、ソースコードやモデルの重みの入手方法がLlama2と異なります。
Llama2-hfは、PyTorchやTensorFlowなどの機械学習フレームワークで動作します。
Llama2-hfは、Hugging Face社のモデルハブで公開されており、簡単にインストールや利用ができます。

Llama2-chat

Llama2-chat（Bard生成）

Llama2-chatは、大規模言語モデル（LLM）であるLlama2のファインチューニングモデルです。高い精度と汎用性を実現しており、自然言語による人間との会話に適しています。

Llama2-chatのパラメータ数は、7B、13B、70Bの3種類です。7Bのパラメータ数は、ChatGPTやPaLMの半分程度ですが、それでも十分な精度と汎用性を実現しています。

Llama2-chatは、有益性と安全性に対する人間の好みに沿うように、監督付き微調整（SFT）と人間のフィードバックによる強化学習（RLHF）を使用します。この技術により、Llama2-chatは、自然言語による人間との会話において、より高い精度と汎用性を実現しています。

**supervised fine-tuning（SFT）**は、教師あり学習の一種で、正解ラベル付きのデータを使ってモデルを学習する手法です。Llama2-chatでは、テキストとラベルのペアで構成された教師データを使って、有益で安全な応答を生成するように学習します。
**reinforcement learning with human feedback（RLHF）**は、強化学習の一種で、人間のフィードバックを使ってモデルを学習する手法です。Llama2-chatでは、人間が生成した応答をフィードバックとして使用し、より有益で安全な応答を生成するように学習します。

Llama2-chat（Bing生成）

Llama2-chatは、Llama2のチャット用に最適化されたバリエーションです。Llama2は、Meta共同開発した次世代の大規模言語モデル（LLM）です。

Llama2-chatは、約70億個のパラメーターを持ち、Llama2と同じデータセットで学習されました。Llama2-chatは、自然な会話や創造的な応答を生成することができるチャット型言語モデルです。Llama2-chatは、人間との対話やエンターテイメントなど、チャットに関連する用途に適しています。

Llama2-chatは、7B、13B、70Bの3種類のパラメータ数があります¹。Llama2-chatは、SFT (Supervised Fine-Tuning) と RLHF (Reinforcement Learning with Human Feedback) を使用して、対話形式のテキスト生成において高い精度と汎用性を実現しています¹ 。。

Llama2-chatの特徴は以下のとおりです。

70億個のパラメーターを持つ大規模言語モデル
チャットに特化した性能や機能を持つ
自然な会話や創造的な応答を生成することができる

Llama2-chat-hf

Llama2-chat-hf（Bard生成）

（Llama2とLlama2-hfとの違いと Llama2-chatとLlama2-hf-chatとの違いは同じでしょうか？、と質問しました）

はい、同じです。

Llama2とLlama2-hfの違いは、以下のとおりです。

Llama2は、Metaが開発したLlama2のオリジナルモデルです。
Llama2-hfは、Hugging Faceが開発したLlama2のHugging Face版です。

Llama2-chatとLlama2-hf-chatの違いは、以下のとおりです。

Llama2-chatは、Metaが開発したLlama2のチャット用に最適化されたバリエーションです。
Llama2-hf-chatは、Hugging Faceが開発したLlama2-chatのHugging Face版です。

つまり、両方ともモデルのベースは同じですが、提供元と、利用できるライブラリが異なるという違いがあります。

具体的には、Llama2はMetaが開発したモデルであり、PyTorchでのみ利用できます。一方、Llama2-hfはHugging Faceが開発したモデルであり、PyTorchやTensorFlowなどの複数の機械学習フレームワークで利用できます。

また、Llama2-chatはMetaが開発したチャット用に最適化されたモデルであり、PyTorchでのみ利用できます。一方、Llama2-hf-chatはHugging Faceが開発したLlama2-chatのHugging Face版であり、PyTorchやTensorFlowなどの複数の機械学習フレームワークで利用できます。

したがって、Llama2とLlama2-hfの違いは、提供元と利用できるライブラリの違いであり、Llama2-chatとLlama2-hf-chatの違いも、提供元と利用できるライブラリの違いです。

Llama2-chat-hf（Bing生成）

（Llama2とLlama2-hfとの違いと Llama2-chatとLlama2-hf-chatとの違いは同じでしょうか？、と質問しました）

Llama2とLlama2-hfとの違いと Llama2-chatとLlama2-hf-chatとの違いは同じではありません。

Llama2とLlama2-hfは、パラメータ数や学習データセットは同じですが、提供元やライセンスやフレームワークや入手方法が異なります¹ ² 。Llama2はMeta社が提供し、有償のライセンスで利用できます¹ 。Llama2-hfはHugging Face社が提供し、無償のオープンソースで利用できます² 。

（何度か聞き直すと”Llama2は、Metaが開発した大規模言語モデルで、商用利用も可能です¹。しかし、Llama2はオープンソースでもあります。”という回答ももらいました）

Llama2はPyTorchで実装されており、Meta社のウェブサイトからダウンロードできます¹ 。Llama2-hfはTransformersライブラリで実装されており、Hugging Face社のウェブサイトからダウンロードできます²。

Llama2-chatとLlama2-hf-chatは、パラメータ数や学習データセットだけでなく、学習手法やパフォーマンスも異なります³ ⁴ 。Llama2-chatはMeta社が提供し、有償のライセンスで利用できます³ 。Llama2-hf-chatはHugging Face社が提供し、無償のオープンソースで利用できます⁴ 。Llama2-chatは7B、13B、70Bの3種類のパラメータ数があります³ 。

Llama2-hf-chatは7Bのパラメータ数しかありません⁴ 。Llama2-chatは監督付き微調整（SFT）と人間のフィードバックによる強化学習（RLHF）を使用して、対話形式のテキスト生成において高い精度と汎用性を実現しています³。

Llama2-hf-chatはSFTとRLHFを使用していません⁴ 。そのため、Llama2-chatはLlama2-hf-chatよりも対話形式のテキスト生成において高い精度と汎用性を実現しています³ ⁴。

汎用言語モデル

汎用言語モデル（Bard生成）

汎用言語モデルは、rinnaが開発した大規模言語モデル（LLM）です。2023年7月31日に公開されました。

パラメータ数は、約40億個です。これは、GPT-3の1/10程度の規模ですが、日本語と英語のバイリンガルモデルであり、汎用性と透明性を高めたモデルとして注目されています。

汎用言語モデルは、日本語と英語のテキスト生成、翻訳、要約、質問応答など、幅広い用途に使用できます。具体的には、

日本語と英語の翻訳
日本語と英語の要約
日本語と英語の質問応答

などに使用できます。

（「汎用」の意味は？と質問）

rinna汎用言語モデルの「汎用」とは、特定のタスクに特化していない、幅広いタスクに利用できるという意味です。LLMには、特定のタスクに特化したモデルと、汎用的なモデルの2種類があります。

特定のタスクに特化したモデルは、そのタスクに関するデータで学習することで、そのタスクにおいて高い性能を発揮できます。一方、汎用的なモデルは、さまざまなタスクに関するデータで学習することで、幅広いタスクに利用できるようになります。

汎用言語モデル（Bing生成）

汎用言語モデルとは、rinna社が開発した日本語と英語のバイリンガル大規模言語モデルです。¹ ²

このモデルは、約40億個のパラメータを持ち、日本語と英語のテキスト生成ができます。¹ ² このモデルは、オープンデータセットを用いて学習されており、透明性が高いです。¹ ²

このモデルは、テキストやコードの生成や理解など、さまざまな用途に向いています。¹ ² また、利用目的に合わせて追加学習することで、モデルをカスタマイズすることも可能です。¹ ²

rinna社は、このモデルを商用利用可能なライセンスでオープンソースとして公開しており、誰でもダウンロードして利用できます。¹ ²

汎用言語モデルの特徴を3つまとめると、以下のようになります。

日本語と英語のバイリンガル大規模言語モデルです。約40億個のパラメータを持ち、日本語と英語のテキスト生成ができます。
オープンデータセットを用いて学習されており、透明性が高いです。また、利用目的に合わせて追加学習することで、モデルをカスタマイズすることが可能です。
商用利用可能なライセンスでオープンソースとして公開されており、誰でもダウンロードして利用できます。

長期コンテキストモデル

長期コンテキストモデル（Bard生成）

長期コンテキストモデルは、rinnaが開発した大規模言語モデル（LLM）です。2023年7月31日に公開されました。

パラメータ数は、約40億個です。これは、汎用言語モデルと同じパラメータ数ですが、入力トークンの上限を2048から8192トークンまで拡大しています。

長期コンテキストモデルは、より長いテキストの入力を可能にする追加学習を行っており、テキスト生成、翻訳、要約、質問応答など、幅広い用途に使用できます。具体的には、

テキストの生成
コンテンツの作成
クリエイティブなテキスト形式の生成

などに使用できます。

長期コンテキストモデルの3つの特徴は、以下のとおりです。

入力トークンの上限拡大：入力トークンの上限を8192トークンまで拡大したことで、より長いテキストの入力を可能にした
汎用性：幅広い用途に対応できる
透明性：学習データにオープンデータセットを用いているため、透明性が高い

なお、長期コンテキストモデルは、汎用言語モデルをベースに開発されたモデルであり、汎用言語モデルの多くの機能を継承しています。

長期コンテキストモデル（Bing生成）

長期コンテキストモデルとは、rinna社が開発した日本語と英語のバイリンガル大規模言語モデルの一種です。¹ ² このモデルは、約40億個のパラメータを持ち、日本語と英語のテキスト生成ができます。¹ ²

汎用言語モデルに対して長いテキストの入力を可能とするための追加学習を行っており、入力トークンの上限を2048から8192トークンまで拡大しています。¹ ²

このモデルは、テキストやコードの生成や理解など、さまざまな用途に向いています。¹ ²

また、利用目的に合わせて追加学習することで、モデルをカスタマイズすることも可能です。¹ ² rinna社は、このモデルを商用利用可能なライセンスでオープンソースとして公開しており、誰でもダウンロードして利用できます。¹ ²

長期コンテキストモデルの特徴を3つまとめると、以下のようになります。

日本語と英語のバイリンガル大規模言語モデルです。約40億個のパラメータを持ち、日本語と英語のテキスト生成ができます。
長いテキストの入力を可能とするための追加学習を行っており、入力トークンの上限を2048から8192トークンまで拡大しています。
商用利用可能なライセンスでオープンソースとして公開されており、誰でもダウンロードして利用できます。

対話言語モデル

対話言語モデル（Bard生成）

対話言語モデルは、rinnaが開発した大規模言語モデル（LLM）です。2023年7月31日に公開されました。

パラメータ数は、約40億個です。これは、汎用言語モデルと同じパラメータ数ですが、対話形式でユーザーの指示に応えるデータを用いた追加学習を行っており、対話型のテキスト生成が可能なモデルです。

対話言語モデルは、対話型のテキスト生成、翻訳、要約、質問応答など、幅広い用途に使用できます。

対話言語モデル（4b）の3つの特徴は、以下のとおりです。

汎用性：幅広い用途に対応できる
対話性：対話型のテキスト生成が可能
透明性：学習データにオープンデータセットを用いているため、透明性が高い

また、対話言語モデルは、対話形式のテキスト生成が可能なことにより、より自然で人間らしい対話型のチャットボットやカスタマーサポートの実現に貢献できると期待されています。

汎用言語モデルとの違いは、以下のとおりです。

対話性：対話言語モデルは対話型のテキスト生成が可能だが、汎用言語モデルは不可能
学習データ：対話言語モデルは対話型のテキスト生成のデータを用いて追加学習しているが、汎用言語モデルはしていない

対話言語モデル（Bing生成）

対話言語モデルとは、rinna社が開発した日本語と英語のバイリンガル大規模言語モデルの一種です。¹ ²

このモデルは、約40億個のパラメータを持ち、日本語と英語のテキスト生成ができます。¹ ²

このモデルは、汎用言語モデルに対して対話形式でユーザーの指示を遂行するように追加学習 (Supervised Fine-Tuning; SFT) を行っており、対話形式のテキスト生成を行うことができます。¹ ²

rinna社は、このモデルを商用利用可能なライセンスでオープンソースとして公開しており、誰でもダウンロードして利用できます。¹ ²

rinna社は、今後も日本のAI研究・開発の発展に貢献するために、さらなる研究成果の発表・公開を行っていくとしています。¹

対話言語モデルの特徴を3つまとめると、以下のようになります。

日本語と英語のバイリンガル大規模言語モデルです。約40億個のパラメータを持ち、日本語と英語のテキスト生成ができます。
対話形式でユーザーの指示を遂行するように追加学習を行っており、対話形式のテキスト生成を行うことができます。
商用利用可能なライセンスでオープンソースとして公開されており、誰でもダウンロードして利用できます。

画像対話モデル

画像対話モデル（Bard生成）

画像対話モデルは、rinnaが開発した大規模言語モデル（LLM）です。2023年7月31日に公開されました。

パラメータ数は、約40億個です。これは、汎用言語モデルと同じパラメータ数ですが、画像とテキストのマルチモーダルデータで学習されており、テキストと画像の両方の情報を処理して、画像に対する対話型のテキスト生成が可能なモデルです。

画像対話モデルは、画像に対する対話型のテキスト生成、翻訳、要約、質問応答など、幅広い用途に使用できます。具体的には、

画像検索
画像の説明
画像の生成

などに使用できます。
3つの特徴は以下のとおりです。

マルチモーダル性：画像とテキストの両方の情報を処理できる
対話性：対話型のテキスト生成が可能
透明性：学習データにオープンデータセットを用いているため、透明性が高い

画像対話モデルは、画像とテキストの両方の情報を処理できます。

汎用言語モデルとの違いは、以下のとおりです。

マルチモーダル性：画像対話モデルは画像とテキストの両方の情報を処理できるが、汎用言語モデルはテキストのみ
学習データ：画像対話モデルは画像とテキストのマルチモーダルデータで学習しているが、汎用言語モデルはテキストのみ

画像対話モデル（Bing生成）

対話言語モデル（4b）とは、rinna社が開発した日本語と英語のバイリンガル大規模言語モデルの一種です。¹ ²

このモデルは、約40億個のパラメータを持ち、日本語と英語のテキスト生成ができます。¹ ²

このモデルは、汎用言語モデル（4b）に対して対話形式でユーザーの指示を遂行するように追加学習 (Supervised Fine-Tuning; SFT) を行っており、対話形式のテキスト生成を行うことができます。¹ ²

rinna社は、このモデルを商用利用可能なライセンスでオープンソースとして公開しており、誰でもダウンロードして利用できます。¹ ²

rinna社は、今後も日本のAI研究・開発の発展に貢献するために、さらなる研究成果の発表・公開を行っていくとしています。¹

対話言語モデル（4b）の特徴を3つまとめると、以下のようになります。

日本語と英語のバイリンガル大規模言語モデルです。約40億個のパラメータを持ち、日本語と英語のテキスト生成ができます。
対話形式でユーザーの指示を遂行するように追加学習を行っており、対話形式のテキスト生成を行うことができます。
商用利用可能なライセンスでオープンソースとして公開されており、誰でもダウンロードして利用できます。

Japanese StableLM Base Alpha 7B

Japanese StableLM Base Alpha 7B（Bard生成）

Japanese StableLM Base Alpha 7Bは、Stability AIが開発した日本語に特化した大規模言語モデル（LLM）です。2023年7月20日に公開されました。

パラメータ数は、約70億個です。これは、GPT-3の1/2程度の規模ですが、日本語のテキストデータで学習されており、日本語の自然言語処理タスクに特化しています。

向いている用途としては、以下のようなものが挙げられます。

日本語のテキスト生成
日本語の翻訳
日本語の要約
日本語の質問応答

また、日本語のクリエイティブなテキスト形式の生成にも利用できます。

今後の予定としては、以下のようなものが挙げられます。

パラメータ数の増加による性能向上
画像や音声などのマルチモーダルデータの学習による性能向上
ユーザーからのフィードバックによる性能向上

Japanese StableLM Base Alpha 7B（Bing生成）

画像対話モデル（4b）とは、rinna社が開発した日本語と英語のバイリンガル大規模言語モデルの一種です。¹ ²

このモデルは、約40億個のパラメータを持ち、日本語と英語のテキスト生成ができます。¹ ²

汎用言語モデル（4b）とBLIP-2を組み合わせた追加学習により、テキストと画像のマルチモーダル入力からのテキスト生成を実現しています。¹ ²

テキストやコードの生成や理解など、さまざまな用途に向いています。¹ ² また、利用目的に合わせて追加学習することで、モデルをカスタマイズすることも可能です。¹ ² rinna社は、このモデルを商用利用可能なライセンスでオープンソースとして公開しており、誰でもダウンロードして利用できます。¹ ²

画像対話モデル（4b）の特徴を3つまとめると、以下のようになります。

日本語と英語のバイリンガル大規模言語モデルです。約40億個のパラメータを持ち、日本語と英語のテキスト生成ができます。
テキストと画像のマルチモーダル入力からのテキスト生成を実現しています。汎用言語モデルとBLIP-2を組み合わせた追加学習により、画像に関連したテキストを生成することができます。
商用利用可能なライセンスでオープンソースとして公開されており、誰でもダウンロードして利用できます。

Japanese StableLM Instruct Alpha 7B

Japanese StableLM Instruct Alpha 7B（Bard生成）

Japanese StableLM Instruct Alpha 7Bは、Stability AIが開発した日本語に特化した大規模言語モデル（LLM）です。2023年7月20日に公開されました。

（実際には8月10日）

向いている用途としては、以下のようなものが挙げられます。

日本語のテキスト生成
日本語の翻訳
日本語の要約
日本語の質問応答

Japanese StableLM Instruct Alpha 7Bは、Japanese StableLM Base Alpha 7Bと、指示に従ったテキスト生成を可能にする追加学習を行ったことにより、対話型のテキスト生成が可能なモデルです。

そのため、向いている用途としては、以下のようなものが挙げられます。

対話型のチャットボット
カスタマーサポート
教育
エンターテインメント

Japanese StableLM Base Alpha 7Bとの違いは、以下のとおりです。

対話性：Japanese StableLM Instruct Alpha 7Bは対話型のテキスト生成が可能だが、Japanese StableLM Base Alpha 7Bは不可能
学習データ：Japanese StableLM Instruct Alpha 7Bは指示に従ったテキスト生成のデータを用いて追加学習しているが、Japanese StableLM Base Alpha 7Bはしていない

Japanese StableLM Instruct Alpha 7B（Bing生成）

Japanese StableLM Instruct Alpha 7Bとは、Stability AIが開発した日本語に特化した大規模言語モデルの一種です。¹

このモデルは、約70億個のパラメータを持ち、日本語と英語のテキスト生成ができます。¹ ²

Japanese StableLM Base Alpha 7Bという汎用言語モデルに対して、対話形式でユーザーの指示を遂行するように追加学習を行っており、対話形式のテキスト生成を行うことができます。¹ ²

テキストやコードの生成や理解など、さまざまな用途に向いています。¹ ² また、利用目的に合わせて追加学習することで、モデルをカスタマイズすることも可能です。¹ ²

ただし、このモデルは研究目的で作成されたものであり、研究目的での利用に限定されています。¹ ²

Japanese StableLM Instruct Alpha 7Bの特徴を3つまとめると、以下のようになります。

日本語に特化した大規模言語モデルです。約70億個のパラメータを持ち、日本語と英語のテキスト生成ができます。
対話形式でユーザーの指示を遂行するように追加学習を行っており、対話形式のテキスト生成を行うことができます。
研究目的で作成されたモデルであり、研究目的での利用に限定されています。

（「Instruct」とは？と質問）

「Instruct」とは、「指示する」という意味です。Japanese StableLM Instruct Alpha 7Bは、ユーザーからの具体的な指示や要求に基づいて、特定のアクションや応答を生成することができる言語モデルです¹。例えば、「西郷隆盛はどんな人物ですか？」や「渋谷で楽しく遊ぶには」という質問に答えることができます² 。

このモデルは、汎用言語モデルであるJapanese StableLM Base Alpha 7Bをファインチューニングして作られています³ 。詳細はHugging Face Hubのページをご覧ください。

Japanese InstructBLIP Alpha

Japanese InstructBLIP Alpha（Bard生成）

Stability AIは、日本語向け画像言語モデル「Japanese InstructBLIP Alpha」を一般公開しました。このモデルは、画像データと日本語テキストデータの両方で学習されており、画像を理解し、テキストで表現することができます。

具体的には、画像キャプション機能と画像についての質問応答機能により、以下のことが可能です。

画像の見た目や特徴を説明する
画像のストーリーを説明する
画像の意味や意図を説明する
画像から質問に答える

これらの機能は、画像の理解と情報発信を支援するために役立ちます。例えば、画像キャプション機能は、画像の見た目や特徴を簡単に説明するためのツールとして、画像についての質問応答機能は、画像から特定の情報を抽出するためのツールとして利用できます。

また、画像キャプション機能と画像についての質問応答機能は、いずれも画像とテキストの両方の情報を利用します。そのため、画像データの学習が進むことで、より精度の高い画像理解と情報発信が可能になると期待されています。

日本語向け指示応答言語モデル「Japanese StableLM Instruct Alpha 7B」を拡張した、画像を元にしたテキストが生成されるモデルです。Japanese StableLM Base Instruct Alpha 7Bとの違いは、以下のとおりです。

画像理解：Japanese InstructBLIP Alphaは画像理解機能を備えている
学習データ：Japanese InstructBLIP Alphaは画像データも学習している

Japanese InstructBLIP Alpha（Bing生成）

Japanese InstructBLIP Alphaとは、Stability AIが開発した日本語に特化した大規模画像言語モデルです。¹ 2023年8月に公開しました。

このモデルは、約70億個のパラメータを持ち、日本語と英語のテキスト生成ができます。¹ ²

Japanese StableLM Base Alpha 7Bという汎用言語モデルをベースにチューニングしたJapanese StableLM Instruct Alpha 7Bを拡張しています。画像を元にしたテキストが生成されるモデルです。

画像を入力として受け取り、それに基づいてテキストを生成するように追加学習を行っており、画像言語モデルInstructBLIPの構造を採用しています。¹ ²

ただし、研究目的で作成されたものであり、研究目的での利用に限定されています。¹ ²

Japanese InstructBLIP Alphaの特徴を3つまとめると、以下のようになります。

日本語に特化した大規模画像言語モデルです。約70億個のパラメータを持ち、日本語と英語のテキスト生成ができます。
画像を入力として受け取り、それに基づいてテキストを生成するように追加学習を行っており、画像言語モデルInstructBLIPの構造を採用しています。
研究目的で作成されたモデルであり、研究目的での利用に限定されています。

マルチモーダル

マルチモーダルとは、複数の形式や手段を組み合わせて処理することです。
例えば、テキストと画像を組み合わせて処理することをマルチモーダル処理と呼びます。テキストの情報と画像の情報とを統合的に処理することで、より精度の高い理解や認識が可能になります。
マルチモーダル処理は、自然言語処理や画像認識などの分野で注目されており、様々な用途に応用されています。

例えば、対話型チャットボットでは、テキストと音声を組み合わせて処理することで、より自然な会話が可能になります。また、自動運転車では、画像とセンサー情報とを組み合わせて処理することで、より安全な運転が可能になります。

具体的なマルチモーダル処理の例としては、以下のようなようなものが挙げられます。

音声認識とテキスト認識を組み合わせた音声入力システム
画像認識と自然言語処理を組み合わせた画像検索システム
センサー情報と画像認識を組み合わせた自動運転システム
テキストと画像を組み合わせた対話型チャットボット
音声とテキストを組み合わせた音声翻訳システム
（ここまでBardが生成）

japanese large language model

japanese large language model（Bard生成）

LINEは、日本語に特化した大規模言語モデル「Japanese Large Language Model」を開発し、2023年7月20日に公開しました。このモデルのパラメータ数は、36億個です。

（実際には8月14日）

このモデルは、日本語のテキストデータで学習されており、日本語の自然言語処理タスクに特化しています。具体的には、以下のタスクに利用できます。

テキスト生成
翻訳
要約
質問応答

モデルの訓練にはLINE独自の大規模日本語Webコーパスを利用。最終的には約650GBのコーパスを学習しています。

LINEのNLPチームが開発したOSSライブラリの HojiChar をフィルタリング処理に利用しています。HojiCharは、日本語のテキストを処理するための強力なライブラリであり、Japanese Large Language Modelのパフォーマンスを向上させるのに役立っています。

LINE独自の大規模日本語Webコーパスは、まだ公開されていません。しかし、LINEの公式ブログによると、このコーパスの公開は、2023年9月末を予定しているとのことです。

このコーパスは、約650GBの日本語Webサイトのデータから構成されており、日本語の多様性や豊かさを反映しています。このコーパスを利用することで、日本語に特化した言語モデルやアプリケーションを開発することができます。

japanese large language model（Bing生成）

japanese-large-lmとは、LINEが開発した日本語の大規模言語モデルです。¹

このモデルは、約36億個のパラメータを持ち、日本語のテキスト生成や理解ができます。¹ このモデルは、約650GBからなる大規模日本語Webコーパスを使用して学習されており、さまざまなドメインやジャンルのテキストをカバーしています。¹

このモデルは、テキストやコードの生成や理解など、さまざまな用途に向いています。¹ また、利用目的に合わせて追加学習することで、モデルをカスタマイズすることも可能です。¹

LINEは、このモデルを商用利用可能なApache License 2.0でオープンソースとして公開しており、誰でもダウンロードして利用できます。¹

LINEは、今後も日本のAI研究・開発の発展に貢献するために、さらなる研究成果の発表・公開を行っていくとしています。¹

japanese-large-lmの特徴を3つまとめると、以下のようになります。

日本語の大規模言語モデルです。約36億個のパラメータを持ち、日本語のテキスト生成や理解ができます。
約650GBからなる大規模日本語Webコーパスを使用して学習されており、さまざまなドメインやジャンルのテキストをカバーしています。
商用利用可能なApache License 2.0でオープンソースとして公開されており、誰でもダウンロードして利用できます。

¹: 36億パラメータの日本語言語モデルを公開しました

japanese-large-lm-instruction-sft

japanese-large-lm-instruction-sft（Bard生成）

LINEは、日本語に特化した大規模言語モデル「Japanese Large Language Model (Instruction-SFT)」を開発し、2023年7月20日に公開しました。このモデルは、36億個のパラメータで構成されています。

（実際には8月14日）

Japanese Large Language Model (Instruction-SFT)は、従来のJapanese Large Language Modelと比較して、対話性能が向上しています。これは、Instruction Tuningと呼ばれる手法を用いて、指示に従ったテキスト生成を可能にする追加学習を行ったことで実現されています。

Instruction Tuningでは、様々なタスクにおけるユーザーの指示 (Instruction) に対して、望ましい出力をするように学習を行います。これにより、データセットに含まれていないような未知のタスクに対しても、指示に沿うような出力が可能です。

Japanese Large Language Model (Instruction-SFT)は、従来のJapanese Large Language Modelよりも、対話型のチャットボットやカスタマーサポートなどの用途に適しています。

Japanese Large Language Model (Instruction-SFT)は、日本語の自然言語処理の可能性を大きく広げるモデルとして期待されています。

Japanese Large Language Modelとの違いは、以下のとおりです。

指示に従ったテキスト生成が可能：Japanese Large Language Model (Instruction-SFT)は、指示に従ったテキスト生成が可能だが、Japanese Large Language Modelは不可能
学習データ：Japanese Large Language Model (Instruction-SFT)は指示に従ったテキスト生成のデータを用いて追加学習しているが、Japanese Large Language Modelはしていない

Japanese Large Language Model (Instruction-SFT)は、Japanese Large Language Modelに指示に従ったテキスト生成機能を付加したモデルであり、対話型のテキスト生成に特化しています。

japanese-large-lm-instruction-sft（Bing生成）

japanese-large-lm-instruction-sftとは、LINEが開発した日本語の大規模言語モデルの一種です。¹

このモデルは、約36億個のパラメータを持ち、日本語のテキスト生成や理解ができます。¹

japanese-large-lmという汎用言語モデルに対して、対話形式でユーザーの指示を遂行するように追加学習 (Instruction Tuning) を行っており、対話形式のテキスト生成を行うことができます。¹

テキストやコードの生成や理解など、さまざまな用途に向いています。¹ また、利用目的に合わせて追加学習することで、モデルをカスタマイズすることも可能です。¹

LINEは、このモデルを商用利用可能なApache License 2.0でオープンソースとして公開しており、誰でもダウンロードして利用できます。¹

japanese-large-lm-instruction-sftの特徴を3つまとめると、以下のようになります。

日本語の大規模言語モデルです。約36億個のパラメータを持ち、日本語のテキスト生成や理解ができます。
対話形式でユーザーの指示を遂行するように追加学習（Instruction Tuning）を行っており、対話形式のテキスト生成を行うことができます。
商用利用可能なApache License 2.0でオープンソースとして公開されており、誰でもダウンロードして利用できます。

また、今回は3.6Bという比較的大きいモデルを高速で学習させるため、DeepSpeedに対応しているDeepSpeed-Chatを用いました。

¹: 36億パラメータの日本語言語モデルによる対話性能向上

Weblab-10B

Weblab-10B（Bard生成）

東京大学松尾研は、100億のパラメータを持つ日本語・英語対応の大規模言語モデル「Weblab-10B」を開発し、2023年8月18日に公開しました。

（実際には8月22日）

Weblab-10Bは、日本語と英語のテキストデータで学習されており、日本語と英語の自然言語処理タスクに特化しています。具体的には、以下のタスクに利用できます。

テキスト生成
翻訳
要約
質問応答

Weblab-10Bは、パラメータ数100億という大規模なモデルであり、日本語と英語の自然言語処理タスクにおいて、従来のモデルを大きく凌駕する性能を実現しています。

例えば、テキスト生成タスクにおいては、BLEUスコアが従来モデルの約2倍に向上しています。また、翻訳タスクにおいては、BLEUスコアが従来モデルの約1.5倍に向上しています。

Weblab-10Bの性能を理解する上で以下の情報は重要です。

Weblab-10Bは、日本語と英語の2ヶ国語に対応した大規模言語モデルであり、事前学習には日本語・英語のデータセットを使用しています。事前学習には、日本語のデータセットであるJapanese-mC4を使用することで、日本語の自然言語処理タスクへの適合性を高めています。また、英語のデータセットであるThe Pileを使用することで、英語の自然言語処理タスクへの適合性を高めています。

Weblab-10B（Bing生成）

Weblab-10Bとは、東京大学松尾研究室が開発した日本語と英語のバイリンガル大規模言語モデルです。¹

このモデルは、約100億個のパラメータを持ち、日本語と英語のテキスト生成や理解ができます。¹

利用目的に合わせて追加学習することで、モデルをカスタマイズすることも可能です。¹ 松尾研は、このモデルを商用利用不可のモデルとして公開しており、誰でもダウンロードして利用できます。¹

Weblab-10Bの特徴を3つまとめると、以下のようになります。

日本語と英語のバイリンガル大規模言語モデルです。約100億個のパラメータを持ち、日本語と英語のテキスト生成や理解ができます。
WebサイトやWebサイトからのデータを用いて学習されており、さまざまなドメインやジャンルのテキストをカバーしています。
商用利用不可のモデルとして公開されており、誰でもダウンロードして利用できます。

技術的な詳細については、以下のような情報があります。

日英2ヶ国語対応の大規模言語モデル開発にあたり、事前学習には代表的な英語のデータセットThe Pileおよび日本語のデータセット Japanese-mC4を使用しました。

（自後学習モデルについは次述）

¹: 東京大学松尾研究室 100億パラメータサイズ・日英2ヶ国語対応の大規模言語モデル“Weblab-10B”を公開

Weblab-10B（事後学習済みモデル）

Weblab-10B（事後学習済みモデル）（Bard生成）

東京大学松尾研は、100億のパラメータを持つ日本語大規模言語モデル「Weblab-10B」の事後学習済みモデルを、2023年9月20日に公開しました。

（実際には8月22日）

このモデルは、事前学習済みモデルであるWeblab-10Bに対して、日本語の自然言語処理タスクに特化した追加学習を行ったことで、従来モデルと比較して対話性能が向上しています。

Weblab-10Bは、次のタスクで、従来のモデルを上回る性能を達成しました。

日本語のテキスト生成
日本語の翻訳（英語→日本語、日本語→英語）
日本語の質問応答

具体的には、以下の点が向上しています。

テキスト生成タスクにおいて、BLEUスコアが従来モデルの約1.5倍に向上
翻訳タスクにおいて、BLEUスコアが従来モデルの約1.2倍に向上
質問応答タスクにおいて、F1スコアが従来モデルの約1.3倍に向上

これらの用途において、より自然で人間らしいテキストの生成や、より正確な情報提供が可能になると期待されています。

Weblab-10Bとの主な違いは、以下のとおりです。

事後学習によって、日本語の自然言語処理タスクに特化した学習を行っている
事後学習によって、従来モデルと比較して対話性能が向上している

この違いにより、Weblab-10Bの事後学習済みモデルは、より自然で人間らしいテキストの生成や、より正確な情報提供が可能になっています。

事後学習には、英語のデータセットであるAlpaca（英語）、Alpaca（日本語訳）、Flan 2021（英語）、Flan CoT（英語）、Flan Dialog（英語）の5つのデータセットを使用することで、さらに精度を向上させています。

なお、Weblab-10Bは、2023年8月18日に、AIの開発プラットフォーム「Hugging Face Hub」にて公開されました。このモデルは、商用利用不可のオープンソースとして公開されています

Weblab-10B（事後学習済みモデル）（Bing生成）

Weblab-10B (事後学習済みモデル)とは、東京大学松尾研究室が開発した日本語と英語のバイリンガル大規模言語モデルの一種です。¹

約Weblab-10Bという汎用言語モデルに対して、対話形式でユーザーの指示を遂行するように追加学習 (Instruction Tuning) を行っており、対話形式のテキスト生成を行うことができます。¹

松尾研は、このモデルを商用利用不可のモデルとして公開しており、誰でもダウンロードして利用できます。¹

Weblab-10B (事後学習済みモデル)の特徴を3つまとめると、以下のようになります。

日本語と英語のバイリンガル大規模言語モデルです。約100億個のパラメータを持ち、日本語と英語のテキスト生成や理解ができます。
対話形式でユーザーの指示を遂行するように追加学習を行っており、対話形式のテキスト生成を行うことができます。
商用利用不可のモデルとして公開されており、誰でもダウンロードして利用できます。

事後学習には、以下の5つのデータセットを使っています。

これらのデータセットは、様々なタスクにおけるユーザーの指示に対して、望ましい出力をするようにモデルを学習させるために用いられました。¹ ²

詳細情報:

1. t.u-tokyo.ac.jp 2. watch.impress.co.jp 3. gunosy.co

¹: 東京大学松尾研究室 100億パラメータサイズ・日英2ヶ国語対応の大規模言語モデル“Weblab-10B”を公開

ELYZA-japanese-Llama-2-7b

ELYZA-japanese-Llama-2-7b（Bard生成）

ELYZA-japanese-Llama-2-7bは、70億のパラメータを持つ日本語大規模言語モデルです。

このモデルは、Llama2をベースとして日本語能力を拡張するために追加事前学習を行ったモデルです。事前学習には、日本語のテキストデータと、英語のテキストデータの両方を用いています。

技術的なポイントとしては、以下のようなものが挙げられます。

事前学習には、日本語のテキストデータと、英語のテキストデータの両方を用いることで、より豊かな表現力と、より正確な情報処理を実現しています。
追加事前学習には、Transformer-XLと呼ばれるアーキテクチャを用いることで、より長い文脈を理解し、より自然なテキストを生成できるようにしています。

向いている用途としては、以下のようなものが挙げられます。

テキスト生成
翻訳
要約
質問応答

3つの特徴をまとめると、以下のようになります。

日本語と英語のテキストデータで学習
Transformer-XLアーキテクチャによる追加事前学習
テキスト生成、翻訳、要約など、幅広い用途に対応

ELYZA-japanese-Llama-2-7b（Bing生成）

ELYZA-japanese-Llama-2-7bは、Meta社が開発した英語ベースの大規模言語モデルLlama 2に対して、日本語テキストで追加事前学習を行った日本語LLMです¹。

このモデルは、文章生成や対話などのタスクに向いており、Hugging FaceのSpacesでチャット形式のサンプルデモを公開しています¹ 。

技術的なポイントとしては、パラメータ数が70億であり、GPT-3.5と同等の性能を持つことや、入力上限が4096トークンであることが挙げられます²。

ELYZA-japanese-Llama-2-7bの特徴は以下の通りです。

日本語LLMとして商用利用可能
GPT-3.5と同等の性能を持つ
入力上限が4096トークンである

今回併せて4つのモデルを公開しています。
いずれもHugging Face Hubにて公開しており、transformersライブラリから利用可能です。

ELYZA-japanese-Llama-2-7b: Llama 2をベースとした70億パラメータの商用利用可能な日本語言語モデル
ELYZA-japanese-Llama-2-7b-instruct: ELYZA-japanese-Llama-2-7bに指示文を入力することで文章生成や対話などのタスクを行うことができるモデル
ELYZA-japanese-Llama-2-7b-fast: ELYZA-japanese-Llama-2-7bの高速化版で、推論速度が約3倍になっています
ELYZA-japanese-Llama-2-7b-fast-instruct: ELYZA-japanese-Llama-2-7b-instructの高速化版で、推論速度が約3倍になっています

ELYZA-japanese-Llama-2-7b-instruct

ELYZA-japanese-Llama-2-7b-instruct（Bard生成）

ELYZA-japanese-Llama-2-7b-instructは、Llama2をベースに日本語能力を拡張するために追加事前学習を行った言語モデルです。

ELYZA-japanese-Llama-2-7b-instructは、ELYZA-japanese-Llama-2-7bと比較して、日本語の文法や語彙をより深く学習したことで、日本語の文脈をより深く理解し、適切な応答を生成できるという特徴があります。

これは、ELYZA-japanese-Llama-2-7b-instructが、ELYZA-japanese-Llama-2-7bよりも多くの日本語データセットで学習されており、より多くの日本語文法や語彙を学習しているためです。

日本語の文法や語彙をより深く学習したことで、以下のような特徴があります。

質問の意図をより正確に理解できる
会話の流れをより自然に把握できる
ユーザーの感情をより正確に理解できる

YZA-japanese-Llama-2-7b-instructの事後学習に使ったデータセットは、ELYZA-tasks-100です。このデータセットは、人間が作成した指示文と、その指示文に応じたテキストのペアで構成されており、100種類のタスクをカバーしています。

ELYZA-tasks-100は、ELYZA社が独自に作成したデータセットです。ELYZA社は、日本語の自然言語処理タスクに精通したエンジニアや研究者によって構成されており、ELYZA-tasks-100のデータセットは、高品質かつ多様性に富んだものとなっています。

ELYZA-tasks-100の利用により、ELYZA-japanese-Llama-2-7b-instructは、人間が作成した指示文をより正確に理解し、適切な応答を生成することができるようになりました。

ELYZA-japanese-Llama-2-7b-instruct（Bing生成）

ELYZA-japanese-Llama-2-7b-instructは、ELYZAが開発した日本語の言語モデルです。

Hugging FaceのSpacesでチャット形式のサンプルデモを公開していることが挙げられます。

ELYZA-japanese-Llama-2-7b-instructの特徴は以下の通りです。

指示文によって柔軟な文章生成や対話が可能
Llama 2をベースとした高品質な日本語言語モデル
Hugging Face Hubにて公開されており、transformersライブラリから利用可能

ELYZA-japanese-Llama-2-7b-instructは、ELYZA-japanese-Llama-2-7bに指示文を入力することで様々な出力を得ることができるモデルです。指示文とは、文章生成や対話などのタスクを指示する文です。

例えば、「私について自己紹介してください」と入力すると、ELYZA-japanese-Llama-2-7b-instructは自己紹介文を生成します。指示文によって柔軟な文章生成や対話が可能です。

ELYZA-japanese-Llama-2-7bとELYZA-japanese-Llama-2-7b-instructの違いは、指示文を入力するかどうかです。ELYZA-japanese-Llama-2-7bは、通常の文章を入力すると、その文章に続く文章を生成します。

ELYZA-japanese-Llama-2-7b-instructは、指示文を入力すると、その指示に従って文章を生成します。両方のモデルは、同じパラメータ数や入力上限を持ちますが、出力の仕方が異なります。

ELYZA-japanese-Llama-2-7b-fast

ELYZA-japanese-Llama-2-7b-fast（Bard生成）

ELYZA-japanese-Llama-2-7b-fastとELYZA-japanese-Llama-2-7bの違いは、主に処理速度です。ELYZA-japanese-Llama-2-7b-fastは、Llama2よりも高速な処理アルゴリズムを用いているため、ELYZA-japanese-Llama-2-7bよりも高速に処理することができます。

具体的には、ELYZA-japanese-Llama-2-7b-fastは、Llama2の処理速度の約2倍に高速化されています。これにより、リアルタイムで自然言語処理を行うようなアプリケーションにおいて、ELYZA-japanese-Llama-2-7b-fastはELYZA-japanese-Llama-2-7bよりも優れた性能を発揮することが期待されています。

ELYZA-japanese-Llama-2-7b-fast（Bing生成）

ELYZA-japanese-Llama-2-7b-fastは、ELYZA-japanese-Llama-2-7bの高速化版で、推論速度が約3倍になっています¹ ³。

トークナイザを改良し、入力文字列をより効率的にトークン化することで、処理時間を短縮しています³。文章生成や対話などのタスクに向いており、Hugging FaceのSpacesでチャット形式のサンプルデモを公開しています³。

ELYZA-japanese-Llama-2-7b-fastとELYZA-japanese-Llama-2-7bの違いは、推論速度です。両方のモデルは、同じパラメータ数や入力上限を持ちますが、出力の速さが異なります。

ELYZA-japanese-Llama-2-7b-fast-instruct

ELYZA-japanese-Llama-2-7b-fast-instruct（Bard生成）

ELYZA-japanese-Llama-2-7b-fast-instructは、Metaが開発した日本語対応の大規模言語モデル（LLM）です。70億個のパラメータを持ち、日本語のテキスト生成、翻訳、質問応答など、幅広いタスクに利用できます。

ELYZA-japanese-Llama-2-7b-fastは、テキストデータのみで事後学習が行われています。一方、ELYZA-japanese-Llama-2-7b-fast-instructは、テキストデータに加えて、コードやマニュアルなどのインストラクション文も事後学習のデータに含んでいます。

ELYZA-japanese-Llama-2-7b-fastとELYZA-japanese-Llama-2-7b-fast-instructは、トークナイザーが異なります。

ELYZA-japanese-Llama-2-7b-fastは、Byte-Pair Encoding (BPE) を用いてトークナイズを行っています。BPEは、トークンを分割する際に、最も頻繁に出現する二文字のペアを結合するアルゴリズムです。

一方、ELYZA-japanese-Llama-2-7b-fast-instructは、SentencePieceを用いてトークナイズを行っています。SentencePieceは、BPEの改良版であり、より長いトークンを分割することができます。

そのため、ELYZA-japanese-Llama-2-7b-fast-instructは、ELYZA-japanese-Llama-2-7b-fastよりも推論速度が速くなります。

（インストラクションとは？と質問）

インストラクション文とは、何かを行うための指示や手順を記した文です。

具体的には、以下のような文がインストラクション文に該当します。

料理のレシピ
家電製品の取扱説明書
プログラミング言語の文法書
マニュアル
指示書

インストラクション文は、目的を達成するために必要な手順や情報を、明確でわかりやすく記述することが重要です。
インストラクション文とは、何かを行うための指示や手順を記した文です。

以下に、いくつかの例を挙げます。

料理のレシピ
- 材料：卵、牛乳、砂糖、小麦粉
- 作り方：1. 卵と砂糖を混ぜ合わせる。2. 牛乳を加えて混ぜ合わせる。3. 小麦粉を加えて混ぜ合わせる。4. フライパンに油を熱し、生地を流し入れる。5. 両面を焼いたら完成。

ELYZA-japanese-Llama-2-7b-fast-instruct（Bing生成）

ELYZA-japanese-Llama-2-7b-fast-instructは、ELYZAが開発した日本語に特化した大規模言語モデル（LLM）です¹ 。このモデルは、MetaのLlama 2をベースに、日本語のテキストデータで追加事前学習を行なっています² 。ELYZA-japanese-Llama-2-7b-fast-instructは、ELYZA-japanese-Llama-2-7bと比べて、トークナイザを改良し、推論速度を1.82倍に高速化しています³ 。

ELYZA-japanese-Llama-2-7b-fast-instructとELYZA-japanese-Llama-2-7b-fastの違いは、主に学習データに含まれるテキストの種類です。ELYZA-japanese-Llama-2-7b-fast-instructは、テキストだけでなく、コードやマニュアルなどのインストラクション文も学習データに含んでいます。そのため、自然な日本語の生成だけでなく、プログラミングや技術に関する文書の生成にも適しています¹。ELYZA-japanese-Llama-2-7b-fastは、インストラクション文を含まない一般的な日本語テキストデータで学習されたモデルです²。また、両方のモデルは、トークナイザーを改良し、推論速度を1.82倍に高速化しています³。

このモデルは、自然言語による人間との会話や、文章の自動生成などに向いています⁵。技術的なポイントとしては、SFT (Supervised Fine-Tuning) や RLHF (Reinforcement Learning with Human Feedback) といった近年の研究開発で培われた要素技術が動員されていることが挙げられます。

（インストラクションとは？と質問）

インストラクション文とは、指示や命令を伝えるための文のことです。インストラクション文は、組み立て方や操作方法などを具体的に説明することが目的です。インストラクション文は、以下のような特徴を持ちます。

命令形や条件形などの文法を使って、手順や条件を明確にする。
箇条書きや番号付けなどのレイアウトを使って、視覚的に分かりやすくする。
図や写真などのイラストレーションを使って、理解を助ける。
専門用語や略語などの用語を使う場合は、定義や説明を付ける。

例えば、以下の文はインストラクション文の一例です。

マイクロ波レンジでご飯を炊く方法

お米を洗ってザルにあける。
耐熱容器にお米と水を入れる。お米1合に対して水は約200mlが目安。
ラップをかけて電子レンジに入れる。600Wの場合は約15分加熱する。
加熱後はそのまま10分ほど蒸らす。
ラップをはずしてふわっと混ぜる。お好みで塩や酢などで味付けする。

ELYZA Tasks 100

ELYZA Tasks 100（Bard生成）

ELYZA Tasks 100は、ELYZA社が作成した日本語の自然言語処理タスクのデータセットです。このデータセットは、100種類の自然言語処理タスクをカバーしており、各タスクに1000件の学習データと100件のテストデータが含まれています。

ELYZA Tasks 100は、以下のようなタスクをカバーしています。

質問応答
要約
翻訳
テキスト生成
自然言語推論
自然言語分類

ELYZA Tasks 100（Bing生成）

ELYZA Tasks 100とは、ELYZAが開発した日本語の言語モデルの性能評価を行うために作成したデータセットです¹。

このデータセットは、多様で複雑な日本語タスクからなり、人間による評価を行うことが可能な件数（100件）に絞っています¹ ²。

ELYZA Tasks 100には、文章生成や対話などのタスクが含まれており、指示文を入力するとその指示に従って文章を生成することができるモデルの能力を測ることができます² 。

ELYZA Tasks 100は、Hugging Face Hubにて公開されており、利用規約に従って自由に利用することができます³。

Codey

Codey（Bard生成）

Codeyは、Google Cloud AIが開発した、Google Colab上で利用できるAIコーディングエディターです。Codeyは、Google AIの機械学習モデルを活用して、コードの自動補完、コードのナビゲーション、コードの修正などの機能を提供します。

Codeyの主な機能は、以下のとおりです。

コードの自動補完：入力したコードの文脈から、次のコードを自動で補完します。
コードのナビゲーション：コードの構造を視覚的に表示し、コードの場所を簡単に見つけることができます。
コードの修正：コードの誤りを自動で検出して修正します。

Codeyは、コードを書くのに慣れていない人でも、簡単にコードを書くことができるツールです。また、コードを書く時間を短縮し、コードの品質を向上させることができます。

以下に、Codeyの具体的な機能について、いくつか例を挙げます。

コードの自動補完では、単語や関数名を入力しただけで、次のコードを自動で補完します。また、入力したコードの文脈から、関連するコードを補完することもできます。
コードのナビゲーションでは、コードの構造を視覚的に表示します。これにより、コードの場所を簡単に見つけることができます。また、コードの行や関数を検索することもできます。
コードの修正では、コードの誤りを自動で検出して修正します。また、コードのスタイルを整えることもできます。

Codeyは、Google Colabを利用するすべてのユーザーが利用できます。Google Colabのメニューバーから「Codey」をクリックすることで、Codeyを起動できます。

（現状利用できるのは機械学習プラットフォームの「Vertex AI」経由のみの模様）

Codey（Bing生成）

Codeyとは、Googleが開発したAIを活用したコーディングモデルの一つです¹。

PaLM 2をベースとした、エンジニアの生産性向上を支援する、コード生成、補完のための基盤モデルです。

Codeyは、高品質で許可された外部のコードの大規模なデータセットに対して微調整されたもので、20種類以上のコーディング言語をサポートしています¹。

Codeyは、コードの補完や自然言語からコードへの生成などのタスクに向いており、Google Colabというオンラインのプログラミング環境に組み込まれています¹。

Codeyは、プログラミングのスピードや品質を向上させたり、初心者と上級者のスキルギャップを埋めたりするなど、開発者にとって有用な機能を提供しています¹。

Codeyの特徴は以下の通りです。

AIを使った高度なコーディングモデル
20種類以上のコーディング言語をサポート
Google Colabに内蔵されており、無料で利用可能

Codeyは、20種類以上のコーディング言語をサポートしています¹ 。対応するプログラミング言語は、Java、JavaScript、TypeScript、PHP、Python、Ruby、Rust、C＋＋、C＃、Go、Kotlin、Scala、Swift、GoogleSQLなどです²。

さらにGoogle Cloud CLIやKubernetes Resource Model（KRM）、Terraformのコードにも対応しています² 。Codeyは、自然言語による指示や説明に基づいてコードを生成したり、補完したりすることができます¹ ²。

（現状利用できるのは機械学習プラットフォームの「Vertex AI」経由のみの模様）

Code Llama

Code Llama（Bard生成）

Code Llamaとは、Meta AIが開発した、コードの生成とデバッグを行うためのAIツールです。Code Llamaは、テキストとコードの膨大なデータセットで学習されており、テキストの指示に従ってコードを生成したり、コードの誤りを検出して修正したりすることができます。

Code Llamaの主な機能は、以下のとおりです。

コードの生成：テキストの指示に従って、コードを生成します。
コードのデバッグ：コードの誤りを検出して修正します。

Code Llamaは、コードを書くのに慣れていない人でも、簡単にコードを生成したり、コードの誤りを修正したりすることができます。また、コードを書く時間を短縮し、コードの品質を向上させることができます。

以下に、Code Llamaの具体的な機能について、いくつか例を挙げます。

コードの生成では、テキストの指示に従って、コードを生成します。
コードのデバッグでは、コードの誤りを検出して修正します。例えば、変数の型が間違っている場合、Code Llamaはそれを検出して修正します。また、コードのスタイルが統一されていない場合、Code Llamaはそれを整えます。

Code Llama（Bing生成）

Code Llamaとは、Meta社が開発したコード生成専用の大規模言語モデル（LLM）です¹。

Code Llamaは、Llama 2というMeta社の英語ベースのLLMをベースに、500Bトークン（約5000億単語）のプログラムに特化したデータセットで学習されたもので、20種類以上のプログラミング言語をサポートしています¹ ² 。

Code Llamaは、自然言語やコードのプロンプトからコードやコードに関する自然言語を生成したり、コードの補完やデバッグを行ったりすることができます¹ ² 。

また、自然言語の指示や質問に応じてコードを生成したり、回答したりすることもできます¹ ²。

Code Llamaは、研究や商用利用のために無料で提供されており、Hugging Face HubやGoogle Colabなどで利用することができます¹³。

Code Llamaの特徴は以下の通りです。

コード生成専用の高性能なLLM
20種類以上のプログラミング言語をサポート
自然言語の指示や質問に対応
無料で利用可能

Code Llama Python

Code Llama Python（Bard生成）

Code Llama PythonとCode Llamaは、どちらもコードの生成とデバッグを行うためのAIツールです。しかし、両者にはいくつかの違いがあります。

Code Llama Pythonは、Pythonに特化したCode Llamaです。そのため、Pythonのコードのみを生成したり、デバッグしたりすることができます。一方、Code Llamaは、Python以外の言語にも対応しています。

また、Code Llama Pythonは、Code Llamaよりも高速な処理速度を実現しています。これは、Pythonのコードは、他の言語のコードよりも処理が高速なためです。

さらに、Code Llama Pythonは、Code Llamaよりも使いやすいインターフェースを備えています。これは、Pythonのコードは、他の言語のコードよりも読みやすく、書きやすいためです。

具体的には、Code Llama Pythonでは、以下の機能が追加されています。

Pythonのライブラリや関数を活用したコードを生成できます。
Pythonのコードのデバッグにおいて、より多くのエラーを検出できます。
Pythonのコードのデバッグにおいて、より効率的な修正方法を提案できます。

Code Llama Pythonは、Pythonのコードを書くための新たな方法を提供し、Pythonのコード作成をより簡単に、より効率的に行うことができる可能性があります。

以下に、Code Llama PythonとCode Llamaの違いをまとめます。

機能	Code Llama Python	Code Llama
対応言語	Python	Python、Java、JavaScript、C++、C、Rust
処理速度	高速	中程度
使いやすさ	高い	中程度
追加機能	Pythonのライブラリや関数を活用したコードの生成、Pythonのコードのデバッグにおいて、より多くのエラーを検出、Pythonのコードのデバッグにおいて、より効率的な修正方法を提案	なし

Bard生成

Code Llama Python（Bing生成）

Code Llama Pythonは、Code Llamaの言語に特化したバリエーションです¹。

Code Llamaは、Meta社が開発した英語ベースの大規模言語モデルLlama 2をベースに、500Bトークン（約5000億単語）のプログラムに特化したデータセットで学習されたもので、20種類以上のプログラミング言語をサポートしています¹ ² 。

Code Llama Pythonは、Code LlamaをPythonコードの100Bトークン（約1000億単語）でさらに微調整したもので、Pythonに関するコード生成や対話などのタスクに向いています¹ ³。

Code Llama PythonとCode Llamaの違いは、Pythonに特化しているかどうかです。

Code Llama Pythonは、Pythonの文法や構造に精通しており、Pythonに関する質問や指示に対応できます¹ ³ 。Code Llamaは、Python以外のプログラミング言語にも対応できますが、Pythonに関する知識は限られています¹ ²。両方のモデルは、同じパラメータ数や入力上限を持ちますが、出力の内容が異なります。

Code Llama PythonとCode Llamaの比較表を作成しました。以下の表をご覧ください。

項目	Code Llama Python	Code Llama
ベースとなるモデル	Llama 2	Llama 2
学習データセット	プログラムに特化した500Bトークン + Pythonコードの100Bトークン	プログラムに特化した500Bトークン
パラメータ数	175億	175億
入力上限	4096トークン	4096トークン
サポートするプログラミング言語	Pythonのみ	20種類以上
自然言語の指示や質問に対応	可能	可能
利用方法	Hugging Face HubやGoogle Colabなどで利用可能	Hugging Face HubやGoogle Colabなどで利用可能
特徴	Pythonに特化した高性能なコード生成モデル	コード生成専用の高性能なLLM

Bing生成

この表は、参考情報として作成したものであり、正確性や完全性を保証するものではありません。詳細については、各モデルの公式サイトやドキュメントをご確認ください。

Code Llama Instruct

Code Llama Instruct（Bard生成）

Code Llama InstructとCode Llamaは、どちらもコードの生成とデバッグを行うためのAIツールですが、Code Llama Instructは、Code Llamaよりも、人間の言語を理解し、それに応じたコードを生成することができます。

Code Llama Instructは、テキストとコードの膨大なデータセットで学習されており、テキストの指示に従って、コードを生成したり、コードの誤りを検出して修正したりすることができます。また、人間の言語を理解し、それに応じたコードを生成することができます。

具体的な機能は、以下のとおりです。

コードの生成：テキストの指示に従って、コードを生成します。
コードのデバッグ：コードの誤りを検出して修正します。
人間の言語を理解し、それに応じたコードを生成します。

Code Llama Instructは、コードを書くのに慣れていない人でも、簡単にコードを生成したり、コードの誤りを修正したりすることができます。また、コードを書く時間を短縮し、コードの品質を向上させることができます。

Code Llama Instructは、2023年8月現在、ベータ版として公開されています。

以下に、Code Llama Instructの具体的な機能について、いくつか例を挙げます。

コードの生成では、テキストの指示に従って、コードを生成します。例えば、「Hello World!」というテキストの指示に従って、Hello World!を表示するコードを生成することができます。また、「10から20までの合計を計算するコードを生成してください」という指示に従って、10から20までの合計を計算するコードを生成することもできます。
コードのデバッグでは、コードの誤りを検出して修正します。例えば、変数の型が間違っている場合、Code Llama Instructはそれを検出して修正します。また、コードのスタイルが統一されていない場合、Code Llama Instructはそれを整えます。

Code Llama Instructは、コードを書くための新たな方法を提供し、コードの作成をより簡単に、より効率的に行うことができる可能性があります。

以下に、Code Llama InstructとCode Llamaの違いをまとめます。

機能	Code Llama Instruct	Code Llama
対応言語	Python、Java、JavaScript、C++、C、Rust	Python、Java、JavaScript、C++、C、Rust
処理速度	中程度	中程度
使いやすさ	高い	中程度
追加機能	人間の言語を理解し、それに応じたコードを生成	なし

Baed生成

Code Llama Instructは、Code Llamaよりも、人間の言語を理解し、それに応じたコードを生成できるという点で、より優れた機能を備えています。

Code Llama Instruct（Bing生成）

Code Llama Instructは、Code Llamaの指示文に特化したバリエーションです¹ ² 。

Code Llama Instructは、Code Llamaを自然言語の指示文や質問に対応するように微調整したもので、コード生成や対話などのタスクに向いています¹ ²。

Code Llama Instructは、Python、C++、Javaなどの人気のあるプログラミング言語をサポートしており、コードの補完やデバッグなどのタスクに利用できます⁴ 。

Code Llama Instructは、研究目的や商用利用のために無料で提供されています⁵。

指示文とは、文章生成や対話などのタスクを指示する文です。

例えば、「PythonでHello Worldを出力するコードを生成してください」と入力すると、Code Llama Instructはその指示に従ってコードを生成します。指示文によって柔軟なコード生成や対話が可能です。

Code Llama InstructとCode Llamaの違いは、指示文に対応しているかどうかです。Code Llama Instructは、指示文を入力するとその指示に従ってコードやコードに関する自然言語を生成したり、回答したりすることができます¹ ² 。

Code Llamaは、指示文以外の自然言語やコードのプロンプトからもコードやコードに関する自然言語を生成したり、補完したりすることができます¹ ²。両方のモデルは、同じパラメータ数や入力上限を持ちますが、出力の内容が異なります。

Code Llama InstructとCode Llamaの比較表を作成しました。以下の表をご覧ください。

ベースとなるモデル	Llama 2	Llama 2
学習データセット	プログラムに特化した500Bトークン + 自然言語の指示文や質問に対応するデータ	プログラムに特化した500Bトークン
パラメータ数	7B, 13B, 34B	7B, 13B, 34B
入力上限	4096トークン	4096トークン
サポートするプログラミング言語	20種類以上	20種類以上
自然言語の指示や質問に対応	可能	可能
利用方法	Hugging Face HubやGoogle Colabなどで利用可能 ¹ ²	Hugging Face HubやGoogle Colabなどで利用可能 ¹ ²
特徴	自然言語の指示文や質問に対応するために微調整されたコード生成モデル	コード生成専用の高性能なLLM

Bing作成

StableCode-Completion-Alpha-3B-4K

StableCode-Completion-Alpha-3B-4K（Bard生成）

StableCode-Completion-Alpha-3B-4Kは、30億4000万のパラメータを持つ、コード生成に特化した大規模言語モデルです。

向いている用途としては、以下のようなものが挙げられます。

コードの生成
コードの翻訳
コードの要約
コードのテスト

また、StableCode-Completion-Alpha-3B-4Kは、コードの正確性と安全性に優れているため、以下の用途にも利用できます。

機械学習モデルのコード生成
セキュリティ脆弱性のあるコードの検出

技術的なポイントとしては、以下のようなものが挙げられます。

Transformerアーキテクチャによる追加事前学習
コードの生成に特化したデータセットで学習

Transformerアーキテクチャは、長い文脈を理解するためのメモリ機構を備えていませんが、StableCode-Completion-Alpha-3B-4Kでは、コードの生成に特化したデータセットで追加事前学習を行うことで、より長いコードを理解し、より自然なコードを生成できるようにしています。

3つの特徴をまとめると、以下のようになります。

30億4000万のパラメータによる高性能
Transformerアーキテクチャによる長い文脈の理解
コードの生成に特化したデータセットによる学習

StableCode-Completion-Alpha-3B-4K（Bing生成）

StableCode-Instruct-Alpha-3Bは、Stability AIが開発した大規模言語モデル（LLM）です¹。このモデルは、30億のパラメータを持ち、Stack Overflowの開発者調査で上位にランクされた多様なプログラミング言語で事前学習されています²。このモデルは、コードの自動生成や指示に従ったコードの生成などに向いています³。

StableCode-Instruct-Alpha-3Bは、StableCode-Completion-Alpha-3B-4Kと比べて、事後学習（instruction tuning）を実施しています³。これにより、自然言語による指示に応じてテキストを生成する能力が向上しています³ 。StableCode-Completion-Alpha-3B-4Kは、コンテキスト長が4Kであることが特徴ですが、StableCode-Instruct-Alpha-3Bはコンテキスト長が不明です² ⁴。

技術的なポイントとしては、以下のことが挙げられます。

BigCode stackデータセットを使用していること。これは、GitHubやStack Overflowなどのオープンソースのコードや質問から構成された大規模なデータセットです⁴。
事後学習にSFT (Supervised Fine-Tuning) という教師あり学習の手法に加え、事後学習（instruction tuning）を実施しています。これにより、自然言語による指示に応じてテキストを生成する能力が向上しています³

StableCode-Instruct-Alpha-3Bの特徴は、以下の3つです。

30億のパラメータを持つLLM
事後学習による指示追従能力の向上
SFTによる高品質なコードの生成

このモデルはStableCode Research Licenseで公開されており、Hugging Faceのサイトから利用できます¹。

Supervised Fine-TuningとInstruction Tuning

Supervised Fine-TuningとInstruction Tuning（Bard生成）

SFTと事後学習のInstruction Tuningは異なります。

SFTは、監督付き微調整（supervised fine-tuning）の略です。これは、事後学習の一種であり、大規模言語モデル（LLM）を特定のタスクに適合させるための手法です。SFTでは、LLMを、そのタスクに関するデータで再学習します。

一方、Instruction Tuningは、LLMのパフォーマンスを向上させるために、人間のフィードバックを使用して、LLMの重みを調整する手法です。Instruction Tuningは、SFTに比べて、より多くの労力と時間が必要ですが、より高い性能を実現できる可能性があります。

SFTと事後学習Instruction Tuningの主な違いは、以下のとおりです。

項目	SFT	Instruction Tuning
種類	事後学習	事後学習
データ	タスクに関するデータ	タスクに関するデータと人間のフィードバック
手法	再学習	重みの調整
労力と時間	少ない	多い
性能	高い	高い（SFTに比べて）

SFTは、事後学習の一種であり、タスクに関するデータでLLMを再学習する手法です。一方、Instruction Tuningは、LLMのパフォーマンスを向上させるために、人間のフィードバックを使用して、LLMの重みを調整する手法です。

Supervised Fine-TuningとInstruction Tuning（Bing生成）

SFTとinstruction tuningは、どちらも事後学習の一種ですが、異なる手法です。SFTは、特定のタスクに関するデータでLLMを再学習することで、そのタスクに適合させる方法です。instruction tuningは、人間の指示に応じてテキストを生成する能力を向上させるために、LLMの重みを調整する方法です。SFTは、データ量や計算コストが少なくて済む利点がありますが、instruction tuningは、より多様なタスクに対応できる可能性があります。¹ ³ ²

StableCode-Instruct-Alpha-3B

StableCode-Instruct-Alpha-3B（Bard生成）

StableCode-Instruct-Alpha-3Bは、30億のパラメータを持つ、コード生成とコード理解に特化した大規模言語モデルです。

StableCode-Completion-Alpha-3B-4Kとの違いは、以下の2点です。

コードの生成に特化したStableCode-Completion-Alpha-3B-4Kに対し、StableCode-Instruct-Alpha-3Bは、コード生成とコード理解の両方に特化しています。
StableCode-Completion-Alpha-3B-4Kは、Transformerアーキテクチャをベースに、コードの生成に特化したデータセットで学習されています。一方、StableCode-Instruct-Alpha-3Bは、Transformerアーキテクチャをベースに、コードの生成とコード理解に特化したデータセットで学習されています。

向いている用途としては、以下のようなものが挙げられます。

コードの生成
コードの翻訳
コードの要約
コードのテスト
コードの理解

（上記の「コード理解に特化」とはどういう意味ですか？）

コード理解に特化とは、コードの意味を理解し、コードの動作を予測できることを意味します。具体的には、以下のようなものが挙げられます。

コードの型や関数の役割を理解する
コードの流れを理解する
コードの動作結果を予測する

（StableCode-Completion-Alpha-3B-4Kはコードを理解するために特化した機能を備えてないのですか？）

はい、StableCode-Completion-Alpha-3B-4Kは、コード理解に特化したモデルではありません。

StableCode-Completion-Alpha-3B-4Kは、コードの生成に特化したモデルであり、コードの意味を理解し、コードの動作を予測する機能は備えていません。

例えば、StableCode-Completion-Alpha-3B-4Kは、以下のようなものを行うことはできません。

コードの型や関数の役割を理解する
コードの流れを理解する
コードの動作結果を予測する

StableCode-Instruct-Alpha-3B（Bing生成）

StableCode-Instruct-Alpha-3Bは、Stability AIが開発した大規模言語モデル（LLM）です¹ 。

このモデルは、30億のパラメータを持ち、Stack Overflowの開発者調査で上位にランクされた多様なプログラミング言語で事前学習されています² 。このモデルは、コードの自動生成や指示に従ったコードの生成などに向いています³。

技術的なポイントとしては、以下のことが挙げられます。

BigCode stackデータセットを使用していること。これは、GitHubやStack Overflowなどのオープンソースのコードや質問から構成された大規模なデータセットです⁴。
SFT (Supervised Fine-Tuning) という教師あり学習の手法を使用していること。これにより、人間のフィードバックを必要とせずに、高品質なコードを生成することができます⁵。

StableCode-Instruct-Alpha-3Bの特徴は、以下の3つです。

30億のパラメータを持つLLM
事後学習（instruction tuning）による指示追従能力の向上
SFTによる高品質なコードの生成

このモデルはStableCode Research Licenseで公開されており、Hugging Faceのサイトから利用できます¹。

自然言語による指示に応じてテキストを生成する能力

（StableCode-Completion-Alpha-3B-4Kは自然言語による指示に応じてテキストを生成する能力を備えてないのですか？）

StableCode-Completion-Alpha-3B-4Kは、自然言語による指示に応じてテキストを生成する能力を備えていないと思われます。

このモデルは、コードの自動補完や生成に特化したモデルであり、事後学習（instruction tuning）を実施していないからです¹。事後学習（instruction tuning）は、自然言語による指示に応じてテキストを生成する能力を向上させるために、LLMの重みを調整する手法です²。この手法を使用しているのは、StableCode-Instruct-Alpha-3Bという別のモデルです³。

このモデルは、StableCode-Completion-Alpha-3B-4Kと同じパラメータ数を持ちますが、事後学習（instruction tuning）により、指示追従能力が向上しています³。したがって、自然言語による指示に応じてテキストを生成する能力を求める場合は、StableCode-Instruct-Alpha-3Bを使用する方が良いでしょう。

StableCode-Completion-Alpha-3B

StableCode-Completion-Alpha-3B（Bard生成）

以下の点を追加することで、StableCode-Completion-Alpha-3B-4Kとの違いを明確にすることができます。

長いコンテキストの理解

StableCode-Completion-Alpha-3Bは、コードの生成に特化したデータセットで追加事前学習を行っています。このデータセットには、GitHubから収集した約100TBのコードと、コードに関する自然言語データが含まれています。また、このデータセットは、最大16,000トークンまでの長いコンテキストで構成されています。

StableCode-Completion-Alpha-3B-4Kは、Transformerアーキテクチャをベースに、コードの生成に特化したデータセットで学習されています。このデータセットには、GitHubから収集した約10TBのコードと、コードに関する自然言語データが含まれています。しかし、このデータセットは、最大4,000トークンまでの短いコンテキストで構成されています。

そのため、StableCode-Completion-Alpha-3Bは、StableCode-Completion-Alpha-3B-4Kよりも長いコンテキストを理解することができ、より自然なコードを生成することができます。

StableCode-Completion-Alpha-3Bは、StableCode-Completion-Alpha-3B-4Kをチューニングしたモデルです。

StableCode-Completion-Alpha-3B-4Kは、Transformerアーキテクチャをベースに、コードの生成に特化したデータセットで学習されています。このデータセットは、最大4,000トークンまでの短いコンテキストで構成されています。

StableCode-Completion-Alpha-3Bは、StableCode-Completion-Alpha-3B-4Kをベースに、Transformerアーキテクチャの長所を活かして、より長い文脈を理解し、より自然なコードを生成できるようにするために、追加事前学習を行っています。このデータセットは、最大16,000トークンまでの長いコンテキストで構成されています。

したがって、StableCode-Completion-Alpha-3Bは、StableCode-Completion-Alpha-3B-4Kをベースに、長い文脈の理解を強化したモデルであると言えます。

StableCode-Completion-Alpha-3B（Bing生成）

StableCode-Completion-Alpha-3Bは、Stability AIが開発した大規模言語モデル（LLM）です¹。このモデルは、30億のパラメータを持ち、Stack Overflowの開発者調査で上位にランクされた多様なプログラミング言語で事前学習されています²。このモデルは、コードの自動補完や生成などに向いています³。

StableCode-Completion-Alpha-3Bは、StableCode-Completion-Alpha-3B-4Kと比べて、コンテキスト長が16Kであることが特徴です²。これにより、より長いコードを処理することができます²。StableCode-Completion-Alpha-3B-4Kは、コンテキスト長が4Kであることで、推論速度が高速化されています⁴。

StableCode-Completion-Alpha-3Bは、StableCode-Instruct-Alpha-3Bと比べて、事後学習（instruction tuning）を実施していないことが違いです⁵。事後学習（instruction tuning）は、自然言語による指示に応じてテキストを生成する能力を向上させるために、LLMの重みを調整する手法です⁶。StableCode-Instruct-Alpha-3Bは、この手法を使用しており、指示追従能力が向上しています⁵。

技術的なポイントとしては、以下のことが挙げられます。

BigCode stackデータセットを使用していること。これは、GitHubやStack Overflowなどのオープンソースのコードや質問から構成された大規模なデータセットです⁷。
SFT (Supervised Fine-Tuning) という教師あり学習の手法を使用していること。これにより、人間のフィードバックを必要とせずに、高品質なコードを生成することができます⁸。

StableCode-Completion-Alpha-3Bの特徴は、以下の3つです。

30億のパラメータを持つLLM
コンテキスト長が16Kで長いコードを処理できる
SFTによる高品質なコードの生成

このモデルはStableCode Research Licenseで公開されており、Hugging Faceのサイトから利用できます¹。

2024年12月
月	火	水	木	金	土	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31