线程池隔离技术与信号量隔离技术

线程池隔离技术与信号量隔离技术

  1. 线程池隔离技术与信号量隔离技术的区别
    hystrix里面,核心的一项功能,其实就是所谓的资源隔离,要解决的最最核心的问题,就是将多个依赖服务的调用分别隔离到各自自己的资源池内
    避免说对某一个依赖服务的调用,因为依赖服务的接口调用的延迟或者失败,导致服务所有的线程资源全部耗费在这个服务的接口调用上
    一旦说某个服务的线程资源全部耗尽的话,可能就导致服务就会崩溃,甚至说这种故障会不断蔓延
    hystrix,资源隔离,两种技术,线程池的资源隔离,信号量的资源隔离
    信号量,semaphore
    信号量跟线程池,两种资源隔离的技术,区别到底在哪儿呢?
    信号量的资源隔离与限流的说明

线程池隔离和信号量隔离的原理以及区别

  1. 线程池隔离技术和信号量隔离技术,分别在什么样的场景下去使用呢??
    线程池:适合绝大多数的场景,99%的,线程池,对依赖服务的网络请求的调用和访问,timeout这种问题
    信号量:适合,你的访问不是对外部依赖的访问,而是对内部的一些比较复杂的业务逻辑的访问,但是像这种访问,系统内部的代码,其实不涉及任何的网络请求,那么只要做信号量的普通限流就可以了,因为不需要去捕获timeout类似的问题,算法+数据结构的效率不是太高,并发量突然太高,因为这里稍微耗时一些,导致很多线程卡在这里的话,不太好,所以进行一个基本的资源隔离和访问,避免内部复杂的低效率的代码,导致大量的线程被hang住
  2. 在代码中加入从本地内存获取地理位置数据的逻辑
    业务背景里面, 比较适合信号量的是什么场景呢?
    比如说,我们一般来说,缓存服务,可能会将部分量特别少,访问又特别频繁的一些数据,放在自己的纯内存中
    一般我们在获取到商品数据之后,都要去获取商品是属于哪个地理位置,省,市,卖家的,可能在自己的纯内存中,比如就一个Map去获取
    对于这种直接访问本地内存的逻辑,比较适合用信号量做一下简单的隔离
    优点在于,不用自己管理线程池拉,不用care timeout超时了,信号量做隔离的话,性能会相对来说高一些
  3. 采用信号量技术对地理位置获取逻辑进行资源隔离与限流
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    public class GetCityNameCommand extends HystrixCommand<String> {
    private Long cityId;
    public GetCityNameCommand(Long cityId) {
    super(Setter.withGroupKey(HystrixCommandGroupKey.Factory.asKey("GetCityNameGroup"))
    .andCommandPropertiesDefaults(HystrixCommandProperties.Setter()
    .withExecutionIsolationStrategy(HystrixCommandProperties.ExecutionIsolationStrategy.SEMAPHORE)));
    this.cityId = cityId;
    }
    @Override
    protected String run() throws Exception {
    return LocationCache.getCityName(this.cityId);
    }
    }

细粒度控制

资源隔离,两种策略,线程池隔离,信号量隔离
对资源隔离这一块东西,做稍微更加深入一些的讲解,告诉你,除了可以选择隔离策略以外,对你选择的隔离策略,可以做一定的细粒度的一些控制

  1. execution.isolation.strategy
    指定了HystrixCommand.run()的资源隔离策略,THREAD或者SEMAPHORE,一种是基于线程池,一种是信号量
    线程池机制,每个command运行在一个线程中,限流是通过线程池的大小来控制的
    信号量机制,command是运行在调用线程中,但是通过信号量的容量来进行限流
    如何在线程池和信号量之间做选择?
    默认的策略就是线程池
    线程池其实最大的好处就是对于网络访问请求,如果有超时的话,可以避免调用线程阻塞住
    而使用信号量的场景,通常是针对超大并发量的场景下,每个服务实例每秒都几百的QPS,那么此时你用线程池的话,线程一般不会太多,可能撑不住那么高的并发,如果要撑住,可能要耗费大量的线程资源,那么就是用信号量,来进行限流保护
    一般用信号量常见于那种基于纯内存的一些业务逻辑服务,而不涉及到任何网络访问请求
    netflix有100+的command运行在40+的线程池中,只有少数command是不运行在线程池中的,就是从纯内存中获取一些元数据,或者是对多个command包装起来的facacde command,是用信号量限流的

    1
    2
    3
    4
    5
    6
    // to use thread isolation
    HystrixCommandProperties.Setter()
    .withExecutionIsolationStrategy(ExecutionIsolationStrategy.THREAD)
    // to use semaphore isolation
    HystrixCommandProperties.Setter()
    .withExecutionIsolationStrategy(ExecutionIsolationStrategy.SEMAPHORE)
  2. command名称和command组
    线程池隔离,依赖服务->接口->线程池,如何来划分
    你的每个command,都可以设置一个自己的名称,同时可以设置一个自己的组

    1
    2
    3
    4
    5
    6
    7
    8
    private static final Setter cachedSetter =
    Setter.withGroupKey(HystrixCommandGroupKey.Factory.asKey("ExampleGroup"))
    .andCommandKey(HystrixCommandKey.Factory.asKey("HelloWorld"));
    public CommandHelloWorld(String name) {
    super(cachedSetter);
    this.name = name;
    }

command group,是一个非常重要的概念,默认情况下,因为就是通过command group来定义一个线程池的,而且还会通过command group来聚合一些监控和报警信息
同一个command group中的请求,都会进入同一个线程池中

  1. command线程池
    threadpool key代表了一个HystrixThreadPool,用来进行统一监控,统计,缓存
    默认的threadpool key就是command group名称
    每个command都会跟它的threadpool key对应的thread pool绑定在一起
    如果不想直接用command group,也可以手动设置thread pool name
    1
    2
    3
    4
    5
    6
    7
    8
    public GetProductInfoCommand(Long productId) {
    super(Setter.withGroupKey(HystrixCommandGroupKey.Factory.asKey("ProductInfoService"))
    .andCommandKey(HystrixCommandKey.Factory.asKey("GetProductInfoCommand"))
    .andThreadPoolKey(HystrixThreadPoolKey.Factory.asKey("GetProductInfoPool")));
    this.productId = productId;
    }

command threadpool -> command group -> command key
command key,代表了一类command,一般来说,代表了底层的依赖服务的一个接口
command group,代表了某一个底层的依赖服务,合理,一个依赖服务可能会暴露出来多个接口,每个接口就是一个command key
command group,在逻辑上去组织起来一堆command key的调用,统计信息,成功次数,timeout超时次数,失败次数,可以看到某一个服务整体的一些访问情况
command group,一般来说,推荐是根据一个服务去划分出一个线程池,command key默认都是属于同一个线程池的
比如说你以一个服务为粒度,估算出来这个服务每秒的所有接口加起来的整体QPS在100左右
你调用那个服务的当前服务,部署了10个服务实例,每个服务实例上,其实用这个command group对应这个服务,给一个线程池,量大概在10个左右,就可以了,你对整个服务的整体的访问QPS大概在每秒100左右
一般来说,command group是用来在逻辑上组合一堆command的
举个例子,对于一个服务中的某个功能模块来说,希望将这个功能模块内的所有command放在一个group中,那么在监控和报警的时候可以放一起看
command group,对应了一个服务,但是这个服务暴露出来的几个接口,访问量很不一样,差异非常之大
你可能就希望在这个服务command group内部,包含的对应多个接口的command key,做一些细粒度的资源隔离
对同一个服务的不同接口,都使用不同的线程池
command key -> command group
command key -> 自己的threadpool key
逻辑上来说,多个command key属于一个command group,在做统计的时候,会放在一起统计
每个command key有自己的线程池,每个接口有自己的线程池,去做资源隔离和限流
但是对于thread pool资源隔离来说,可能是希望能够拆分的更加一致一些,比如在一个功能模块内,对不同的请求可以使用不同的thread pool
command group一般来说,可以是对应一个服务,多个command key对应这个服务的多个接口,多个接口的调用共享同一个线程池
如果说你的command key,要用自己的线程池,可以定义自己的threadpool key,就ok了

  1. coreSize
    设置线程池的大小,默认是10
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    public GetProductInfoCommand(Long productId) {
    super(Setter.withGroupKey(HystrixCommandGroupKey.Factory.asKey("ProductInfoService"))
    .andCommandKey(HystrixCommandKey.Factory.asKey("GetProductInfoCommand"))
    .andThreadPoolKey(HystrixThreadPoolKey.Factory.asKey("GetProductInfoPool"))
    //线程池大小,一般来说用默认的10就够了
    .andThreadPoolPropertiesDefaults(HystrixThreadPoolProperties.Setter().withCoreSize(20)));
    this.productId = productId;
    }

一般来说,用这个默认的10个线程大小就够了

  1. queueSizeRejectionThreshold
    控制queue满后reject的threshold,因为maxQueueSize不允许热修改,因此提供这个参数可以热修改,控制队列的最大大小
    HystrixCommand在提交到线程池之前,其实会先进入一个队列中,这个队列满了之后,才会reject
    默认值是5
    线程池+queue的工作原理

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    public GetProductInfoCommand(Long productId) {
    super(Setter.withGroupKey(HystrixCommandGroupKey.Factory.asKey("ProductInfoService"))
    .andCommandKey(HystrixCommandKey.Factory.asKey("GetProductInfoCommand"))
    .andThreadPoolKey(HystrixThreadPoolKey.Factory.asKey("GetProductInfoPool"))
    //线程池大小,一般来说用默认的10就够了
    .andThreadPoolPropertiesDefaults(HystrixThreadPoolProperties.Setter().withCoreSize(20)
    //线程池缓冲队列大小
    .withQueueSizeRejectionThreshold(10)));
    this.productId = productId;
    }
  2. execution.isolation.semaphore.maxConcurrentRequests
    设置使用SEMAPHORE隔离策略的时候,允许访问的最大并发量,超过这个最大并发量,请求直接被reject
    这个并发量的设置,跟线程池大小的设置,应该是类似的,但是基于信号量的话,性能会好很多,而且hystrix框架本身的开销会小很多
    默认值是10,设置的小一些,否则因为信号量是基于调用线程去执行command的,而且不能从timeout中抽离,因此一旦设置的太大,而且有延时发生,可能瞬间导致tomcat本身的线程资源本占满

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    public GetCityNameCommand(Long cityId) {
    super(Setter.withGroupKey(HystrixCommandGroupKey.Factory.asKey("GetCityNameGroup"))
    .andCommandKey(HystrixCommandKey.Factory.asKey("GetCityNameCommand"))
    .andThreadPoolKey(HystrixThreadPoolKey.Factory.asKey("GetCityNamePool"))
    .andCommandPropertiesDefaults(HystrixCommandProperties.Setter()
    .withExecutionIsolationStrategy(HystrixCommandProperties.ExecutionIsolationStrategy.SEMAPHORE)
    .withExecutionIsolationSemaphoreMaxConcurrentRequests(15)));
    this.cityId = cityId;
    }