最近项目上线,基础架构是这样的:
1台存储服务器,2台GPU服务器。这两台GPU都需要读取存储上的数据,并且走万兆网卡。为了节约成本,采用七类网线直连的方式,将GPU服务器和存储服务器连接起来,两台GPU之间不需要通信。
直接写出遇到的问题及解决方法吧:
一开始的配置:
存储服务器配置两个IP:10.10.10.41、10.10.10.42
GPU1配置一个IP:10.10.10.31
GPU2配置一个IP:10.10.10.51
现象:如果存储服务器只激活任意一个IP,则可以和GPU服务器通信。如果同时激活两个IP,则和GPU服务器都无法通信。折腾了好久,最终找到了原因:存储服务器上的两个IP在同一个网段内,服务器不知道走哪个网口。
修改后的配置:
存储服务器配置两个IP:10.10.10.41、20.20.20.42
GPU1配置一个IP:10.10.10.31
GPU2配置一个IP:20.20.20.51
存储服务器上的两个IP改成不同网段,存储服务器和两台GPU之间可以同时通信了。
|