LINE、日本語の大規模言語モデル公開
2023年8月17日 09時51分更新
LINEは8月14日、大規模日本語言語モデル「japanese-large-lm(ジャパニーズ ラージ エルエム)」をオープンソースで公開し、商用利用(Apache License 2.0)も可能としている。
LINEでは2020年11月から日本語に特化した大規模言語モデル「HyperCLOVA」の構築と応用に関わる研究開発に取り組んできたが、それと並行して別の開発ライン(LINEのMassive LM開発ユニット)にて構築された。
公開されたモデルは、HuggingFace Hubで公開されており、transformersライブラリから利用できる。36億パラメータモデル、17億パラメータモデルの二種類が公開されている。
「japanese-large-lm」の構築には、約650GBの大規模日本語Webコーパスが用いられており、一般的な英語の大規模コーパスと遜色ないデータ量であるという。
指示文に対して適切な出力をするようにチューニングしたモデルを近日中に公開し、今後も構築したモデルの一部を継続的に公開する。
関連カテゴリー