GPTと生成モデル
推論速度
推論時にGPTモデルが1秒あたりに生成できるトークン数を示すパフォーマンス指標で、モデルサイズ、計算の最適化、使用されるハードウェアによって影響されます。このメトリックはリアルタイムアプリケーションにとって重要です。
← 戻る推論時にGPTモデルが1秒あたりに生成できるトークン数を示すパフォーマンス指標で、モデルサイズ、計算の最適化、使用されるハードウェアによって影響されます。このメトリックはリアルタイムアプリケーションにとって重要です。
← 戻る