
回答:评估机房首先看三大类:结构与电力、环境控制与物理安全。检查并确认机房是否具备冗余供电(如UPS、柴油发电机)、电力等级与N+1或2N冗余设计;机房的制冷与PUE值(越低越节能)以及冷热通道管理;地理风险(地震、洪水、邻近危险源)。
要求供应商提供机房的TIER等级、PUE报告、UPS与发电机运行记录、机房平面图与机柜布局图;现场考察要看门禁(生物识别、双重验证)、监控摄像头、消防系统(FM-200 / 气体灭火)、防水与防尘措施。
优先选择通过ISO 27001、SOC 2、PCI-DSS(如果涉及支付)等体系认证的机房;检查定期审计报告与第三方渗透测试/物理安全审计记录。
要求SLA中明确物理可用性(如99.99%机房可用性)、设备上架/开通时限、以及现场工程师到达时间(例如4小时内)和现场维护权限。
回答:网络质量不仅看带宽数字,还要看出口冗余、骨干互联、运营商对等(peering)和到目标用户群的延迟与丢包率。要求提供带宽来源图(carrier map)、BGP路由策略与多运营商接入证明。
进行多点延迟测试(从国内主要城市、目标国家/地区到机房做ping/traceroute)、链路带宽测试(iperf)以及在高峰期与非高峰期采样;同时做丢包与抖动(jitter)统计,查看30天/90天平均值与峰值。
关注:平均延迟(ms)、丢包率(%)、抖动(ms)、可用带宽(实际吞吐);对全球业务还要看国际出口带宽和CDN或本地缓存策略。若目标用户在中国大陆,要特别评估国际出口稳定性与是否已申请ICP或使用加速方案。
确认是否提供多链路、多运营商冗余、自动BGP failover;SLA应包含网络可用性与链路修复时限(MTTR)与赔偿条款。
回答:运维支持质量直接影响生产系统稳定性。评估要看支持时间(24/7)、响应等级(电话、工单、紧急热线)、语言能力(韩语、英语、中文)、远程与现场支持能力(Remote Hands)。
要求明确SLA中的响应时间(例如紧急事件15分钟响应、4小时现场到达)、故障升级路径、联络人及值班制度;查看历史工单处理效率与客户评价。
了解是否使用集中监控平台(如Zabbix/Prometheus)、告警策略、自动化运维脚本与版本管理体系;最好能接入你的监控并提供API/告警推送。
询问运维工程师资质(Linux/Windows认证、网络证书)、是否有项目经理负责变更管理、是否支持重大变更前的回滚计划与变更窗口沟通。
回答:备份与灾备要同时考虑RPO(可接受数据丢失时间)和RTO(恢复时间目标)。确认机房是否提供快照、异地复制、冷备/热备站点选择,以及定期演练记录。
检查备份策略(增量/全量、保留周期)、备份加密与传输安全、异地备份地点是否与主站点处于不同风险域(不同城市或国家)。要求演练报告来验证恢复流程的真实性。
可选的高可用方案包括跨可用区负载均衡、数据库主从同步、实时复制(如DRP/BCP服务)。确认费用、流量限制与数据恢复测试频率。
在合同中写明灾备演练周期、恢复验证的合格标准以及未达标时的违约责任和补救措施。
回答:除了单纯带宽/机柜价格外,要评估迁移支持、扩容灵活性、网络端口可用性、跨地域扩展能力以及隐藏成本(流量费、跨国流量、IP费、远程操作费)。
确认是否提供免费/付费的迁移服务(数据迁移、线路切换)、测试机/临时带宽、上架时间窗口及代维服务;了解IP地址管理策略与公网IP分配费用。
查看机房是否支持按需扩容(按机柜、按U、按带宽计费)、是否支持混合部署(本地+云)、是否有多区域节点方便进行负载分布和灾备。
评估合同期限、退租条款、数据清除保证、当地法律(如韩国的个人信息保护法PIPA)对数据存放与跨境传输的要求,确保长期合规性与成本可控。