SelfHostLLM - 为自托管大型语言模型推理计算GPU内存需求。