C8e50db7c860442e1bfde13790e9aebc
Android架构之高可用移动网络连接

文末可获取进入小专栏读者群方式。

正文

读者好,前面我们在《Android 架构之网络连接与加速》《Android 架构之长连接技术》两篇文章中,讲解了Http短连接、TCP长连接、连接复用与速度优化、数据压缩等方面的知识点。不过,真实的网络环境是很复杂的,存在各种各样的因素会导致网络服务不可用,比如DNS劫持、服务器宕机、弱网等。换言之,如果服务都不可用,那上面这些优化也就没有意义了。

因此,本文主要谈一下在真实的网络环境下,存在哪些常见的网络不可用原因,以及大多数公司是如何解决并兜底,从而达到高可用连接这个目标的。

文章会从下面几方面进行阐述:

  • DNS劫持与可靠IP获取
    • HttpDNS
    • 内置IP列表+自动测速
  • IP列表的缓存更新策略
  • IP列表可用性兜底策略
  • 针对弱网的多IP复合连接测速
  • 自主网络诊断

DNS劫持与可靠IP获取

我们知道,大多数的网络请求第一步就是DNS过程,经过1-RTT的时间将域名转化为IP地址,然后再去发起请求。但是,有相关经验的开发者应该了解,DNS过程不仅耗时不稳定(3G下200ms,4G下100ms),而且可能解析失败,甚至被劫持,将用户导入到了错误的IP地址。如果攻击者自己做一个仿冒的网站,劫持你的DNS并将IP转到这个假网站上,可能会造成很大的用户数据泄漏和公司品牌损失。

为了解决这个问题,获得可靠的IP列表,现有大厂会采用下面一些方案:

1. HTTPDNS

比如阿里云和腾讯云都推出了自己的HttpDNS服务,在全国多地部署相关的服务器提供安全解析DNS服务。

基本的原理就是通过发起Http请求到HttpDNS服务器,获取某个域名对应的可用IP列表。这个IP列表可以根据用户当前的地点进行返回,而且默认会进行IP测速,按速度排序。同时,伴随这IP列表,服务器还会下发一个缓存有效时间 TTL,有了这个时间,客户端可以放心的将IP列表缓存在本地,并在即将过期前及时去更新IP列表,保证每次网络请求都可以使用当前最优的IP地址。

2. 内置IP列表+自动测速

当然,自建HttpDNS服务需要一定规模的机房部署、大量的客户端测速数据上报、全球IP库收集等,需要不少的投入。因此,有些公司比如携程就采用了更加轻量一点的方案:内置IP列表

具体原理如下:

在APK打包时会内置一份IP列表进去。当App启动时,这些IP的权重相同,此时会随机从里面获取IP来使用。但是这有个问题,对不同地区的用户而言,最优IP肯定是不同的。比如对于上海的用户而言,上海区服务器的IP肯定是最快的,而对于深圳的用户而言,华南区IP才是最快的。因此,在App运行过程中,我们会通过依次对IP列表逐个进行Ping测速,根据测速结果动态变更IP的权重,然后提供给网络连接使用。

IP列表的缓存更新策略

通过HttpDNS或内置IP列表的方案,我们可以为网络层提供一份相对可靠的IP地址作为缓存,每次需要发起请求时,直接从缓存里读取这份IP列表即可建立IP直连。

那新的问题来了,移动网络是在不断变化的。最常见的场景,比如我们从Wi-Fi切换到了4G,获取进入电梯后从4G降级成3G,或者我们从A Wi-Fi换到了B Wi-Fi,这都意味着我们的网络链路变更了。那么,之前缓存的IP列表是否仍然可用,或者仍然最优呢?

显然并不一定,比如从Wi-Fi切到了移动4G,背后整条网络链路都不同了,之前的IP列表很有可能不是最优的了,极端情况下可能某些IP地址也不可用了。因此,我们需要最好IP列表的及时更新,保证无论网络如何切换,我们都能使用最优的IP地址列表。

具体有下面几种方式:

  1. 定时器监听HttpDNS返回的TTL过期时间。当IP列表即将过期前,发起请求获取下一轮的IP列表并进行更新;
  2. 监控网络连接状态,网络链路切换,比如Wi-Fi/3G/4G转换,如果是Wi-Fi,还可以监控SSID信息变更(针对不同的Wi-Fi热点),及时触发IP列表刷新;在异步更新过程中,可以仍然使用旧缓存IP提供服务;
  3. 配置中心下发,这种有时会用在服务器分流,比如某台服务器压力过大,可以通过配置中心系统下发新的IP列表给客户端访问。

另外,IP列表缓存应该对不同网络类型、网络标识有对应的一份缓存,可以使用网络类型(3G、4G、Wi-Fi等)+网络标识(SSID、ispCode等)作为缓存Key,当网络切换时,使用Key去查询缓存。

这些缓存可以持久化到多个文件,以Key作为文件名,同时可以基于当前网络状态,缓存一份IP列表到内存供使用,当网络状态变化,则刷新内存缓存。

IP列表可用性兜底策略

通过更新机制,我们可以保证本地IP列表缓存动态更新的及时性。那么,如果HttpDNS服务器出现故障呢,或者首次打开App,HttpDNS还没有完成,或者大面积DNS劫持等,怎么办呢?

所以说,除了及时获取最优IP列表,我们还要考虑,如果获取不到IP列表,如何进行兜底?保证用户的网络请求不受影响。

在线上运行中,可以采取下面四组IP兜底策略,按优先级排列如下:

  • HttpDNS IP:即大厂自建的HttpDNS服务获取动态IP;
  • DNS IP:即常规Local DNS获取IP;
  • Auth IP:通过配置下发的动态保底IP列表;
  • Hardcode IP:本地写死的保底IP列表
top Created with Sketch.