float16指定でVRAM8GB環境でも質問2~3程度なら動作可能。さすがにGPUを使うと数秒でさっと回答が得られるので速い

float16指定でVRAM8GB環境でも質問2~3程度なら動作可能。さすがにGPUを使うと数秒でさっと回答が得られるので速い