本文用于连续记录近期关于大模型推理部署的思考和答疑。后续相关问题都追加到本文,不再按每个主题拆成新的文档。
记录格式:
## 问题 N:问题标题
### 我的思考 / 问题
用户提出的问题或阶段性理解。
### 答疑结论
直接结论。
### 扩展知识
相关背景、架构、示例和实践建议。
原创...大约 76 分钟
本文用于连续记录近期关于大模型推理部署的思考和答疑。后续相关问题都追加到本文,不再按每个主题拆成新的文档。
记录格式:
## 问题 N:问题标题
### 我的思考 / 问题
用户提出的问题或阶段性理解。
### 答疑结论
直接结论。
### 扩展知识
相关背景、架构、示例和实践建议。
以更安全的⽅式管控和登录各种类型的资产。

堡垒机的 4A 能力

测试网络性能
带宽(Bandwidth)
吞吐量(throughput)
通过官网或镜像站[^1]获取下载链接
选择系统架构及所需镜像版本


GPU 直通已成为PVE下获取GPU性能的最佳方案,但独占模式使得GPU变得很局限;比如我有俩个VPS都需要使用GPU,那么加入俩张物理显卡进行分配
当然使用Proxmox VE(PVE)虚拟化的GPU可以通过以下几种方案来实现
相对来说还是比较灵活,当然每种方案都有利有弊这里会简要的总结一下特点:
| 方案 | 性能 | 运行模式 | 成本 |
|---|---|---|---|
| intel GVT-g | 最低(intel集成显卡) | 多台VPS可同时使用 | 低(随有核显CPU的得到) |
| Nvida vGPU | 高(可控) | 多台VPS可同时使用 | 昂贵且vGPU需商业授权 |
| GPU Passthrough | 高(视显卡型号) | 独占1台VPS来使用 | 按需购买独立显卡 |
| Docker-Nvidia | 较高(视显卡型号) | 宿主独占 多Docker同时使用 | 按需购买独立显卡 |

监控系统可以实时监控和管理系统、网络设备、应用程序等,帮助运维管理员及时发现和解决问题,提高系统的可用性、安全性和性能,节约运维成本。
Zabbix 是一个企业级的开源分布式网络监控解决方案;可用于监视各种IT设备,包括服务器、网络设备、数据库、应用程序等。
- 企业级:Zabbix具有可扩展性、高可用性、安全性、可定制性和易于使用和管理等特点,这使得它成为了一种适合大型企业和组织使用的监控系统。
- 开源:Zabbix是一个开源的监控系统,意味着它是免费的,并且源代码是公开的,可以自由地使用、修改和分发。
- 分布式:Zabbix支持分布式监控,这意味着可以将监控负载分散到多个Zabbix服务器上,从而实现更高的可扩展性和容错性。