基于kubernates实现高可用微服务架构

Kubernetes (K8s) is an open-source system for automating deployment, scaling, and management of containerized applications.

kubernateskubernetes.io

本文主要讲述如何部署一个用于web服务的高可用kubernates集群。该架构能够较好的适用于微服务体系，内置的服务发现机制给微服务治理带来了极佳的体验。

集群架构

话不多说，架构图如下：

digraph G { rankdir="TB" rank="same" node [ shape="box" style="filled" ]

subgraph cluster_node0 {
    label="(2+)* master or slave"
    ex_proxy[label="proxy",fillcolor="red"]
    in_proxy[label="proxy",fillcolor="red"]
    controller1[label="kube-controller",fillcolor="gray"]
    scheduler1[label="kube-scheduler",fillcolor="gray"]
}
in_proxy->apiserver1[label=watch,dir=both]

subgraph cluster_node1 {
    label="3*master"

    weave1[label="weave",fillcolor="gray"]

    kubelet1[label="kubelet",fillcolor="gray"]

    apiserver1[label="kube-apiserver",fillcolor="red"]
    etcd1[label="etcd",fillcolor="red"]

    apiserver1->etcd1
}
subgraph cluster_node2 {
    label="n*slave"

    weave2[label="weave",fillcolor="gray"]

    kubelet2[label="kubelet",fillcolor="gray"]
    pods2[label="pod ...",fillcolor="white"]
}

ex_request[label=外网请求,shape=none,style=empty]
in_request[label=内网请求,shape=none,style=empty]

ex_request -> ex_proxy[style=dashed,label=req]
in_request -> in_proxy[style=dashed,label=req]
ex_proxy -> in_proxy[style=dashed,label=req]
in_proxy->pods2[style=dashed,label=req]

in_proxy->pods2[label="health check"]

}

这里，我们把集群相关服务分了三类：

必须部署在master上的服务
必须部署在slave上的服务
master和slave都可以部署的服务

其中，kubelet和weave是集群内每台机器必须部署的服务，无需过多研究。

kube-shceduler和kube-controller主要用于集群管理，正常部署即可。

kube-apiserver和etcd是集群master核心，简单来说，集群所有相关服务都需要通过和apiserver通信来控制集群行为。

用户所需要部署的服务都运行在slave的pod中。

以上服务都部署完成后，集群就可以正常运行了。那么用户的服务如何被请求到，是接下来要解决的重要问题。

微服务治理

所谓微服务治理，笔者认为主要是管理当前已经部署的那些服务如何被请求到。

kubernate本身提供了kube-proxy和service用于提供所部署服务的请求方案。基于这个方案，能够实现服务的正常访问，甚至还提供了负载均衡。但是在实践过程中总会发现一些问题，较难处理：

如何方便快速的告诉服务使用方怎么请求我的服务？
事实上，当你新上线一个服务时，你需要从全局获取一个可用端口，然后用这个端口部署你的服务，然后告诉服务使用方带端口请求kube-proxy。
负载均衡能否做到高可用？
kube-proxy实现了负载均衡，能够让请求均匀的发送到不同的实例。然而，当实际部署实例的一个节点出问题的时候，kube-proxy并不能立即知道这个问题，也就不能够及时摘掉问题节点。这个时候你会发现，这样的效果跟直接部署在几台机器上没什么区别。
如何请求到指定实例，如何让两次请求请求到同一个实例？
由于机制和理念问题，这个做不到。

如此一来，如果使用该方案，那么就不得不再单独设计服务治理以及高可用负载均衡方案。也就是说，我们现在只能这么干。

在上面的架构图中，proxyCode on Github就是这样一个提供了服务发现和高可用负载均衡的服务。

本质上讲，proxy是一个完整的反向代理服务，如果你熟悉nginx，那么结合lua脚本的开发，也可以做到proxy所做的事情：增加一个上游服务的自定义健康检查功能。

此外，proxy还实现了一个通过请求kube-apiserver接口，来监控集群变化，进而更新proxy配置的插件。

使用该插件，用户需要定义：

部署项目名
项目服务端口名到端口的映射

通过上面两项，可以按照规则生成当前项目的一些列域名，每个域名都可以被代理到对应的端口，即实现了约定式的服务发现。

日志收集

通过在每个slave节点上创建日志目录，并将其默认挂载到所有pods的docker上，只要服务的日志都输出到指定路径，即可统一被slave机器上的filebeat收集到日志服务器。

集群监控

通过收集proxy的健康检查日志，可以实现实时集群监控。