日本語言語モデルベンチマークStability-AI/lm-evaluation-harnessのスコア

日本語言語モデルベンチマークStability-AI/lm-evaluation-harnessのスコア