大模型运行效率预测工具 v3 / LLM Runtime & Energy Prediction Tool v3

LoRA / GraphRAG 运行时间与能耗预测 · Runtime & Energy

GPU 数量 / GPUs:
模型规模（B） / Model Size (B):
数据量（K） / Data Size (K):
Batch Size（批大小）:

GPU 数量 / GPUs:
模型规模（B） / Model Size (B):
并发度 / Parallel:
生成 Token 数 / Output Tokens:

GPU 数量 / GPUs:
模型规模（B） / Model Size (B):
并发度 / Parallel:
输入 Token 数 / Input Tokens: