1.
需求与目标确认
第一步列出业务需求:并发连接数、峰值带宽、允许最大延迟(例如交互类低于50ms)、容忍的丢包率和SLA要求。把需求量化成测试目标(如持续1小时10Gb/s吞吐或延迟P95小于60ms)。
2.
准备测试环境与账号
在香港与新加坡各准备一台公网VPS或裸金属用于测试。确保有root权限、开放iperf3、ICMP、TCP端口(如5201)以及能够运行mtr/traceroute。记录IP、ASN和机房提供商信息。
3.
基础连通性测试步骤
在本地或客户侧执行:ping -c 20
,traceroute -n (Linux)或 tracert (Windows)。保存RTT、跳数和超时。对比HK/SG到目标用户群(如中国、东南亚、印度等)的结果。
4.
路由和丢包深度诊断
使用mtr进行长跑测试:mtr -rwzbc100 (运行100次,显示丢包与平均延迟)。分析哪一跳开始出现丢包或延迟飙升,判断是国际链路、IX互联点还是目的端问题。
5.
带宽吞吐测试(iperf3)
在目标机房做服务端:iperf3 -s。客户端运行:iperf3 -c -P 10 -t 60 -R(反向测试)及 iperf3 -c -P 10 -t 300(持续测试)。记录平均带宽、抖动和重传率。对比单流与多流表现。
6.
UDP和抖动测试
若业务对实时性敏感,使用iperf3 UDP测试:iperf3 -c -u -b 100M -t 60,结合 -l 设置包长。测得丢包率与抖动后判断链路是否适合VoIP/实时应用。
7.
并发与峰值压力测试
模拟峰值:多台客户端并行发起iperf3或wrk/ab等HTTP压测。监测目标机的CPU、NIC占用、队列溢出(dmesg)与丢包。确认端口速率(1Gb/10Gb)是否成为瓶颈。
8.
MTU、TCP调优与网卡设置
排查是否受MTU影响(特别是GRE/VPN/跨境隧道):ping -M do -s 。调整TCP窗口、启用window scaling、开启网卡offload(gro/gso/tso)并记录性能差异。
9.
互联/对等(Peering)与CDN策略
检查机房是否在主要IX(HKIX、SGIX)有对等或直连运营商。若目标用户分布广,优先选择有良好对等与多个上游的机房,或结合CDN将静态流量外放以降低主链路压力。
10.
成本与SLA对比步骤
把带宽费用(按95th计费或包月)、端口费用、交叉连接与公网IP成本列成表格。结合测试数据评估性价比。关注SLA里丢包/可用率/修复时长条款。
11.
制作决策矩阵与最终验证
根据延迟(P50/P95)、带宽吞吐、丢包、成本、SLA与扩展性给各项打分。选出1-2个候选机房后做真实业务流量灰度迁移(低比例流量),监控7x24数据以最终确认。
12.
部署注意事项与运营监控
部署时启用BGP冗余、配置健康检查、设置流量镜像用于排查、并建立自动化告警(延迟、丢包、带宽饱和)。定期每月重复iperf3与mtr自动化测试,记录趋势。
13.
实用命令汇总
常用命令示例:iperf3 -s;iperf3 -c -P 10 -t 60;mtr -rwzbc100 ;ping -c 50 ;traceroute -n 。把结果保存为CSV,便于比较与存档。
14.
常见判断规则速查表
参考阈值:交互应用P95延迟<50ms优选,<100ms可接受;视频流止丢包率<1%,实时应用抖动<30ms;带宽抖动与重传高时首查链路丢包/MTU/硬件能力。
15.
问:香港机房相比新加坡在延迟上通常差别有多大?
答:一般来说,面向中国大陆用户香港机房延迟更低(常见到广州/深圳20ms以内),而新加坡到中国大陆延迟通常高10-40ms;但面向东南亚、印度或澳大利亚,新加坡往往更优。
16.
问:选择带宽计费模式(按95th还是包月)有什么实操建议?
答:如果流量有明显峰值且可通过缓存/CDN削峰,包月端口成本清晰;若流量变化大且短期峰值难控,可测算95th成本后比较,测试期间务必模拟真实峰值来估算费用。
17.
问:做最终迁移前最关键的三项必须验证是什么?
答:一是实测P95延迟与丢包(用mtr/iperf3验证);二是峰值吞吐是否可持续(并发压测);三是机房与运营商之间的对等与带宽冗余(检查IX互联与BGP拓扑)。完成这三项才可放心切换。
来源:选择香港新加坡机房部署方案时的带宽与延迟比较指南