스레드 풀과 Executor 프레임워크2

ExecutorService 우아한 종료 - 소개

고객의 주문을 처리하는 서버를 운영중이라 할 때, 만약 서버 기능을 업데이트 하기 위해 서버를 재시작 한다고 해보자.

이때 서버 애플리케이션이 고객의 주문으로 처리하고 있는 도중에 갑자기 재시작 된다면, 해당 고객의 주문이 제대로 진행되지 못할 것이다.

가장 이상적인 방향은 새로운 주문 요청은 막고, 이미 진행중인 주문은 모두 완료한 다음 서버를 재시작 하는 것이 가장 좋을 것이다. (이처럼 서비스를 안정적으로 종료하는 것도 매우 중요하다..)

이렇게 문제 없이 우아하게 종료되는 방식을 graceful shutdown 이라 한다.

ExecutorService 의 종료 메서드

ExecutorService 를 줄여서 앞으로 서비스라고 하겠다. ExecutorService 에는 종료와 관련된 다양한 메서드가 존재한다.

서비스 종료

void shutdown()
- 새로운 작업을 받지 않고, 이미 제출된 작업을 모두 완료한 후 종료 (대기 작업도 포함이다)
- 논 블로킹 메서드 (이 메서드를 호출한 스레드는 대기하지 않고 즉시 다음 코드를 호출한다)
List<Runnable> shutdownNow()
- 실행 중인 작업을 중단(인터럽트)하고, 대기 중인 작업을 반환하며 즉시 종료한다.
- 실행 중인 작업을 중단하기 위해서 인터럽트를 발생시킨다.
- 논 블로킹 메서드

서비스 상태 확인

boolean isShutdown()
- 서비스가 종료되었는지 확인한다.
boolean isTerminated()
- shutdown() , shutdownNow() 호출 후, 모든 작업이 완료되었는지 확인한다.

작업 완료 대기

boolean awaitTermination(long timeout, TimeUnit unit) throws InterruptedException
- 서비스 종료시 모든 작업이 완료될 때까지 대기한다. 이때 지정된 시간까지만 대기한다.
- 블로킹 메서드

close()

close() 는 자바 19부터 지원하는 서비즈 종료 메서드이다. 이 메서드는 shutdown() 과 같다고 생각하면 된다.
- 더 정확히는 shutdown() 을 호출하고, 하루를 기다려도 작업이 완료되지 않으면 shutdownNow() 를 호출한다. (거의 이런일은 없을 것이다..)
- 호출한 스레드에 인터럽트가 발생해도 shutdownNow() 를 호출한다.

ExecutorService 우아한 종료 - 구현

shutdown() 을 호출해서 이미 들어온 모든 작업을 다 처리하고 서비스를 우아하게 종료 하는 것이 가장 이상적이지만, 갑자기 요청이 너무 많이 들어와서 큐에 대기중인 작업이 너무 많아 작업 완료 어렵거나, 작업이 너무 오래 걸리거나, 또는 버그가 발생해서 특정 작업이 끝나지 않을 수 있다.

이렇게 되면 서비스가 너무 늦게 종료되거나, 종료되지 않는 문제가 발생할 수 있다.

이럴 때는 보통 우아하게 종료하는 시간을 정한다. 예를 들어서 60초까지는 작업을 다 처리할 수 있게 기다리는 것이다. 그리고 60초가 지나면, 무언가 문제가 있다고 가정하고 shutdownNow() 를 호출해서 작업들을 강제로 종료한다.

close()

close() 의 경우 이렇게 구현되어 있다. shutdown() 을 호출하고, 하루를 기다려도 작업이 완료되지 않으면 shitdownNow() 를 호출한다. 하지만 대부분 하루를 기다릴 수 는 없다.

우선은 shutdown() 을 통해 우아한 종료를 시도하고, 10초간 종료되지 않으면 shutdownNow() 를 통해 강제 종료하는 방식을 구현해보자.

package thread.executor;

import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
import java.util.concurrent.TimeUnit;

import static thread.executor.ExecutorUtils.printState;
import static util.MyLogger.log;

public class ExecutorShutdownMain {

    public static void main(String[] args) {
        ExecutorService es = Executors.newFixedThreadPool(2);
        es.execute(new RunnableTask("taskA"));
        es.execute(new RunnableTask("taskB"));
        es.execute(new RunnableTask("taskC"));
        es.execute(new RunnableTask("longTask", 100_000));  // 100초 대기
        printState(es);
        log("== shutdown 시작 ==");
        shutdownAndAwaitTermination(es);
        log("== shutdown 완료 ==");
        printState(es);
    }

    private static void shutdownAndAwaitTermination(ExecutorService es) {
        // non-blocking,
        // 새로운 작업을 받지 않고 처리중이거나 이미 대기중에 작업은 처리한다. 이후에 풀의 스레드를 종료한다.
        es.shutdown();
        try {
            // 이미 대기중인 작업들을 모두 완료할 때까지 10초 기다린다.
            if(!es.awaitTermination(10, TimeUnit.SECONDS)){
                // 정상 종료가 너무 오래 걸리면
                log("서비스 정상 종료 실패 -> 강제 종료 시도");
                es.shutdownNow();
                // 작업(자원정리)이 취소될 때 까지 대기한다.
                if(!es.awaitTermination(10, TimeUnit.SECONDS)){
                    log("서비스가 종료되지 않았습니다.");
                }
            }
        } catch (InterruptedException e) {
            // awaitTermination() 으로 대기중인 스레드에 외부 인터럽트 요청이 오는 경우 대비 
            es.shutdownNow();
        }
    }
}

코드 분석

작업 처리에 필요한 시간

taskA , taskB , taskC : 1초
longTask : 100초

서비스 종료

es.shutdown();

새로운 작업을 받지 않는다. 처리 중이거나, 큐에 이미 대기중인 작업은 처리한다. 이후에 풀의 스레드를 종료한다.
shutdown() 은 블로킹 메서드가 아니다.. 서비스가 종료될 때 까지 main 스레드가 대기하지 않는다. main 스레드는 바로 다음 코드를 호출한다.

if (!es.awaitTermination(10, TimeUnit.SECONDS)){...}

블로킹 메서드이다.
main 스레드는 대기하면서 서비스 종료를 10초간 기다린다.
- 만약 10초 안에 모든 작업이 완료된다면 true 를 반환한다.
여기서 taskA, taskB, taskC 의 수행이 완료된다. 그런데 longTask 는 10초가 지나도 완료되지 않았다.
- 따라서 false 를 반환한다.

서비스 정상 종료 실패 -> 강제 종료 시도

// 정상 종료가 너무 오래 걸리면
log("서비스 정상 종료 실패 -> 강제 종료 시도");
es.shutdownNow();
// 작업(자원정리)이 취소될 때 까지 대기한다.
if(!es.awaitTermination(10, TimeUnit.SECONDS)){
    log("서비스가 종료되지 않았습니다.");
}

정상 종료가 10초 이상 너무 오래 걸렸다.
shutdownNow() 를 통해 강제 종료에 들어간다. shutdown() 과 마찬가지로 블로킹 메서드가 아니다.
강제 종료를 하면 작업 중인 스레드에 인터럽트가 발생한다. 다음 로그를 통해 인터럽트를 확인할 수 있다.
인터럽트가 발생하면서 스레드도 작업을 종료하고, shutdownNow() 를 통한 강제 shutdown 도 완료된다.

서비스 종료 실패

그런데 마지막에 강제 종료인 es.shutdownNow() 를 호출한 다음 왜 10초를 기다릴까?

shutdownNow() 가 작업 중인 스레드에 인터럽트를 호출하는 것은 맞다. 인터럽트를 호출하더라도 여러 이유로 작업에 시간이 걸릴 수 있다. 인터럽트 이후에 자원을 정리하는 어떤 간단한 작업을 수행할 수 있다. 이런 시간을 기다려주는 것이다.

극단적이지만 최악의 경우 스레드가 인터럽트를 받을 수 없는 코드를 수행할 수 있다. 이 경우 인터럽트 예외가 발생하지 않고 스레드도 계속 수행한다.

인터럽트를 받을수 없는 코드

while(true) { // Empty }

위 작업을 수행하는 스레드는 자바를 강제 종료해야 작업을 종료할 수 있다.

또는 인터럽트를 인지하지 못할 수도 있다..

이런 경우를 대비해서 강제 종료 후 10초간 대기해도 작업이 완료되지 않는다면 "서비스가 종료되지 않았습니다." 라는 로그를 남겨두어야 나중에 문제를 확인할 수 있다.

Executor 스레드 풀 관리 - 코드

이번 챕터에서는 Executor 프레임워크가 어떤식으로 스레드를 관리하는지 알아보자.

이 부분을 알아두면 실무에서 대량의 요청을 스레드에서 어떤식으로 처리해야 하는지에 대한 기본기를 쌓을 수 있다.

ExecutorService 의 기본 구현체인 ThreadPoolExecutor 의 생성자는 다음 속성을 사용한다.

corePoolSize : 스레드 풀에서 관리되는 기본 스레드의 수
maximumPoolSize : 스레드 풀에서 관리되는 최대 스레드 수
keepAliveTime, TimeUnit unit : 기본 스레드 수를 초과해서 만들어진 초과 스레드가 생존할 수 있는 대기 시간, 이 시간 동안 처리할 작업이 없다면 초과 스레드는 제거된다.
BlockingQueue workQueue : 작업을 보관한 블로킹 큐

예제

corePoolSize, maximumPoolSize 의 차이를 알아보는 예제를 만들자.

package thread.executor;

import java.util.concurrent.ExecutorService;
import java.util.concurrent.ThreadPoolExecutor;

import static util.MyLogger.log;

public abstract class ExecutorUtils {

    public static void printState(ExecutorService executorService) {
        if (executorService instanceof ThreadPoolExecutor poolExecutor) {
            int pool = poolExecutor.getPoolSize();
            int active = poolExecutor.getActiveCount();
            int queuedTasks = poolExecutor.getQueue().size();
            long completedTask = poolExecutor.getCompletedTaskCount();
            log("[pool=" + pool + ", active=" + active + ", queuedTasks=" + queuedTasks + ", completedTask=" + completedTask + "]");
        } else {
            log(executorService);
        }
    }
    
    // 추가
    public static void printState(ExecutorService executorService, String taskName) {
        if (executorService instanceof ThreadPoolExecutor poolExecutor) {
            int pool = poolExecutor.getPoolSize();
            int active = poolExecutor.getActiveCount();
            int queuedTasks = poolExecutor.getQueue().size();
            long completedTask = poolExecutor.getCompletedTaskCount();
            log(taskName + " -> [pool=" + pool + ", active=" + active + ", queuedTasks=" + queuedTasks + ", completedTask=" + completedTask + "]");
        } else {
            log(executorService);
        }
    }
}

package thread.executor.poolsize;

import thread.executor.RunnableTask;

import java.util.concurrent.*;

import static thread.executor.ExecutorUtils.printState;
import static util.MyLogger.log;
import static util.ThreadUtils.sleep;

public class PoolSizeMainV1 {
    public static void main(String[] args) {
        ArrayBlockingQueue<Runnable> workQueue = new ArrayBlockingQueue<>(2);
        ExecutorService es = new ThreadPoolExecutor(2, 4, 3000, TimeUnit.MILLISECONDS, workQueue);

        printState(es);

        es.execute(new RunnableTask("task1"));
        printState(es, "task1");

        es.execute(new RunnableTask("task2"));
        printState(es, "task2");

        es.execute(new RunnableTask("task3"));
        printState(es, "task3");

        es.execute(new RunnableTask("task4"));
        printState(es, "task4");

        es.execute(new RunnableTask("task5"));
        printState(es, "task5");

        es.execute(new RunnableTask("task6"));
        printState(es, "task6");

        try{
            es.execute(new RunnableTask("task7"));
        }catch (RejectedExecutionException e){
            log("task7 실행 거절 예외 발생 : " + e);
        }

        sleep(3000);
        log("== 작업 수행 완료 ==");
        printState(es);

        sleep(3000);
        log("== maximunPoolSize 대기 시간 초과 ==");
        printState(es);

        es.close();
        log("== shutdown 완료 ==");
    }
}

ArrayBlockingQueue<Runnable> workQueue = new ArrayBlockingQueue<>(2);
ExecutorService es = new ThreadPoolExecutor(2, 4, 3000, TimeUnit.MILLISECONDS, workQueue)

작업을 보관할 블로킹 큐의 구현체로 ArrayBlockingQueue(2) 를 사용했다. 사이즈를 2로 설정했으므로 최대 2개까지 작업을 큐에 보관할 수 있다.
corePoolSize=2, maximumPoolSize=4 를 사용해서 기본 스레드는 2개, 최대 스레드는 4개로 설정했다.
- 스레드 풀에 기본 2개의 스레드를 운영한다. 요청이 너무 많거나 급한 경우 스레드 풀은 최대 4개까지 스레드를 증가시켜서 사용할 수 있다.
3000, TimeUint.MILLISECONDS
- 초과 스레드가 생존할 수 있는 대기 시간을 뜻한다. 이 시간 동안 초과 스레드가 처리할 작업이 없다면 초과 스레드는 제거된다.
- 여기서는 3000 밀리초(3초) 를 설정했으므로, 초과 스레드가 3초간 작업을 하지 않고 대기한다면 초과 스레드는 스레드 풀에서 제거된다.

실행 결과

Executor 스레드 풀 관리 - 분석

실행 분석

task1 작업을 요청한다.
Executor 는 스레드 풀에 스레드가 core 사이즈 만큼 있는지 확인한다.
- core 사이즈 만큼 없다면 스레드를 하나 생성한다.
- 작업을 처리하기 위해 스레드를 하나 생성했기 때문에, 작업을 큐에 넣을 필요 없이, 해당 스레드가 바로 작업을 처리한다.

새로 만들어진 스레드1이 task1 을 수행한다.

task2 작업을 요청한다.
Executor 는 스레드 풀에 스레드가 core 사이즈만큼 있는지 확인한다.
- 아직 core 사이즈 만큼 없으므로 스레드를 하나 생성한다.
새로 만들어진 스레드2가 task2 를 처리한다.

task3 작업을 요청한다.
Executor 는 스레드 풀에 스레드가 core 사이즈 만큼 있는지 확인한다.
core 사이즈 만큼 스레드가 이미 만들어져 있고, 스레드 풀에 사용할 수 있는 스레드가 없으므로 이 경우 큐에 작업을 보관한다.

task4 작업 또한 큐에 작업을 보관한다.

task5 작업을 요청한다.
Executor 는 스레드 풀의 스레드 core 사이즈 만큼 있는지 확인한다. -> core 사이즈 만큼 있다.
Executor 는 큐에 보관을 시도한다. -> 큐가 가득 찼다.

큐가 가득 차면 긴급 상황으로 대기하는 작업이 꽉 찰 정도로 요청이 많다는 뜻이다. 이 경우 Executor 는 max(aximumPoolSize) 사이즈까지 초과 스레드를 만들어서 작업을 수행한다.

초과 스레드인 스레드3 을 만든다.
스레드3 이 작업을 처리한다.

task6 또한 큐가 가득 찼다.
초과 스레드인 스레드4가 이 작업을 처리한다.

task7 작업을 요청한다.
큐가 가득 찼다.
스레드 풀의 스레드도 max 사이즈 만큼 가득 찼다.
RejectedExecutionException 이 발생한다.

이 경우 큐에 넣을 수도 없고, 작업을 수행할 스레드도 만들 수 없다. 따라서 작업을 거절한다.

모든 작업이 완료되고,
초과 스레드들은 지정된 시간동안 작업을 하지 않고 대기하면 제거된다. 긴급한 작업이 끝난 것으로 이해하면 된다.
여기서는 지정한 3초간 스레드3, 스레드4가 작업을 진행하지 않았기 때문에 스레드 풀에서 제거된다.
참고로 작업 요청이 계속해서 들어오면 지정된 시간은 계속 초기화된다.

초과 스레드가 제거된 모습이다.
이후에 shutdown() 이 진행되면 풀의 스레드도 모두 제거된다.

Executor 전략 - 고정 풀 전략

Executor 스레드 풀 관리 - 다양한 전략

ThreadPoolExecutor 를 사용하면 스레드 풀에 사용되는 숫자와 블로킹 큐등 다양한 속성을 조절할 수 있다.

corePoolSize : 스레드 풀에서 관리되는 기본 스레드의 수
maximumPoolSize : 스레드 풀에서 관리되는 최대 스레드 수
keepAliveTime, TimeUnit unit : 기본 스레드 수를 초과해서 만들어진 스레드가 생존할 수 있는 대기 시간, 이 시간 동안 처리할 작업이 없다면 작업 스레드는 제거된다.
BlockingQueue workQueue : 작업을 보관한 블로킹 큐

자바는 Executors 클래스를 통해 3가지 기본 전략을 제공한다.

newSingleThreadPool(): 단일 스레드 풀 전략
newFixedThreadPool(nThreads): 고정 스레드 풀 전략
newCachedThreadPool() : 캐시 스레드 풀 전략

newSingleThreadPool() : 단일 스레드 풀 전략

스레드 풀에 기본 스레드 1개만 사용한다.
큐 사이즈에 제한이 없다. (LinkedBlockingQueue)
주로 간단히 사용하거나, 테스트 용도로 사용한다.

new ThreadPoolExecutor(1, 1,0L, TimeUnit.MILLISECONDS,
                             new LinkedBlockingQueue<Runnable>())

Executor 스레드 풀 관리 - 고정 풀 전략

newFixedThreadPool(nThreads)

스레드 풀에 nThreads 만큼의 기본 스레드를 생성한다. 초과 스레드는 생성하지 않는다.
큐 사이즈에 제한이 없다. ( LinkedBlockingQueue )
스레드 수가 고정되어 있기 때문에 CPU, 메모리 리소스가 어느정도 예측 가능한 안정적인 방식이다.

new ThreadPoolExecutor(nThreads, nThreads, 0L, TimeUnit.MILLISECONDS,
                             new LinkedBlockingQueue<Runnable>())

package thread.executor.poolsize;

import thread.executor.RunnableTask;

import java.util.concurrent.*;

import static thread.executor.ExecutorUtils.printState;
import static util.MyLogger.log;

public class PoolSizeMainV2 {
    public static void main(String[] args) {
        ExecutorService es = Executors.newFixedThreadPool(2);
//        ExecutorService es = new ThreadPoolExecutor(2, 2,
//                0L, TimeUnit.MILLISECONDS,
//                new LinkedBlockingQueue<Runnable>());
        log("pool 생성");
        printState(es);

        for (int i = 1; i <= 6; i++) {
            String taskName = "task" + i;
            es.execute(new RunnableTask(taskName));
            printState(es, taskName);
        }

        es.close();
        log("== shutdown 완료 ==");
    }
}

특징

스레드 수가 고정되어 있기 때문에, CPU, 메모리 리소스가 어느정도 예측 가능한 안정적인 방식이다.
큐 사이즈도 제한이 없어서 작업을 많이 담아두어도 문제가 없다.

주의

이 방식의 가장 큰 장점은 스레드 수가 고정되어서 CPU, 메모리 리소스가 어느 정도 예측이 가능하다는 점이다.
따라서 일반적인 상황에 가장 안정적으로 서비스를 운영할 수 있다.
하지만 상황에 따라 장점이 가장 큰 단점이 되기도 한다.

상황1 - 점진적인 사용자 확대

개발한 서비스가 잘 되어서 사용자가 점점 늘어난다.
고정 스레드 정략을 사용해서 서비스를 안정적으로 잘 운영했는데, 언젠가부터 사용자들이 서비스 응답이 점점 느려진다고 항의한다.

상황2 - 갑작스런 요청 증가

마케팅 팀의 이벤트가 성공하면서 갑자기 사용자가 폭증했다.
고객은 응답을 받지 못한다고 항의한다.

확인

개발자는 급하게 CPU, 메모리 사용량을 확인해보는데, 아무런 문제 없이 여유있고, 안정적으로 서비스가 운영되고 있다.
고정 스레드 전략은 스레드 수가 고정되어 있다. 따라서 사용자가 늘어나도 CPU, 메모리 사용량이 확 늘어나지 않는다.
큐의 사이즈를 확인해보니, 요청이 수 만건 쌓여있다. 요청이 처리되는 시간보다 쌓이는 시간이 더 빠른 것이다. 참고로 고정 풀 전략의 큐 사이즈는 무한이다.
서비스 초기에는 사용자가 적기 때문에, 문제가 되지 않지만, 사용자가 늘어나면서 문제가 될 수 있다.
갑작스런 요청 증가도 마찬가지이다.

결국 서버 자원은 여유가 있는데, 사용자만 점점 느려지는 문제가 발생한 것이다.

Executor 전략 - 캐시 풀 전략

newCachedThreadPool()

기본 스레드를 사용하지 않고, 60초 생존 주기를 가진 초과 스레드만 사용한다.
초과 스레드의 수는 제한이 없다.
큐에 작업을 저장하지 않는다. (SynchronousQueue)
- 대신에 생산자의 요청을 스레드 풀의 소비자 스레드가 직접 받아서 바로 처리한다.
모든 요청을 대기하지 않고 스레드가 바로 처리한다. 따라서 빠른 처리가 가능하다.

new ThreadPoolExecutor(0, Integer.MAX_VALUE, 60L, TimeUnit.SECONDS,
                               new SynchronousQueue<Runnable>());

SynchronousQueue 는 아주 특별한 블로킹 큐이다.
BlockingQueue 의 인터페이스 중 하나이다.
이 큐는 내부에 저장 공간이 없다. 대신에 생산자의 작업을 소비자 스레드에게 직접 전달한다.
쉽게 이야기해서 저장 공간의 크기가 0이고, 생산자 스레드가 큐에 작업을 전달하면 소비자 스레드가 큐에서 작업을 꺼낼 때까지 대기한다.
소비자 작업을 요청하면 기다리던 생산자가 소비자에게 직접 작업을 전달하고 반환된다. 그 반대의 경우도 같다.
이름 그대로 생산자와 소비자를 동기화하는 큐이다.
쉽게 이야기해서 중간에 버퍼를 두지 않는 스레드간 직거래라고 생각하면 된다.
SynchronousQueue 의 단점은 무엇일까?
버퍼가 없어서 유연성이 부족하다
일반 큐(LinkedBlockingQueue, ArrayBlockingQueue)는 “일단 받아놓고 나중에 처리”가 가능
SynchronousQueue는 “즉시 처리 못 하면 버림 or 대기” 밖에 없음
→ 대량 요청/응답 처리에 불리함 🧠 즉시 소비 가능한 구조에서만 적합 (ex. 고속 핸드오프)
생산자/소비자 수가 비동기적으로 불균형하면, put() 또는 take()가 블로킹된다.
소비자가 없는데 생산자가 put() → ❗ 블로킹
생산자가 없는데 소비자가 take() → ❗ 블로킹
→ 실시간성이 안 맞거나, 작업량이 불규칙한 시스템에서는 불안정
ThreadPoolExecutor에서 사용할 경우, 워커 스레드를 계속 만들어야 할 수 있다
// 내부적으로 SynchronousQueue 사용
ExecutorService executor = Executors.newCachedThreadPool();
큐에 쌓아둘 수 없기 때문에 → 작업 하나 들어올 때마다 스레드 하나씩 생성
스레드 풀 제한이 없으면, 수천 개 스레드가 생길 수 있음 🧨 즉, 실수하면 OOM(OutOfMemoryError) 또는 CPU 부하로 이어질 수 있음
모니터링이나 디버깅이 어렵다
큐의 상태를 볼 수 없음 (큐가 없으니까)
→ 얼마나 쌓였는지, 대기 중인지 등의 가시성 부족
SynchronousQueue 를 언제 사용하면 좋을까?
스레드 수를 자동 조절하면서 즉시 실행이 필요한 경우
예: newCachedThreadPool() 같은 짧은 작업에 적합한 고성능 비동기 처리 구조
단, 부하 예측이 불가능한 시스템에는 매우 조심해서 사용❗

package thread.executor.poolsize;

import thread.executor.RunnableTask;

import java.util.concurrent.*;

import static thread.executor.ExecutorUtils.printState;
import static util.MyLogger.log;
import static util.ThreadUtils.sleep;

public class PoolSizeMainV3 {
    public static void main(String[] args) {
        ExecutorService es = Executors.newCachedThreadPool();
//        ExecutorService es = new ThreadPoolExecutor(0, Integer.MAX_VALUE,
//                                      60, TimeUnit.SECONDS,
//                                      new SynchronousQueue<Runnable>());
        log("pool 생성");
        printState(es);

        for (int i = 1; i <= 4; i++) {
            String taskName = "task" + i;
            es.execute(new RunnableTask(taskName));
            printState(es, taskName);
        }

        sleep(3000);
        log("== 작업 수행 완료 ==");
        printState(es);

        sleep(3000);
        log("== maximumPoolSize 대기 시간 초과 ==");
        printState(es);

        es.close();
        log("== shutdown 완료 ==");
        printState(es);
    }
}

특징

캐시 스레드 풀 전략은 매우 빠르고, 유연한 전략이다.
이 전략은 기본 스레드도 없고, 대기 큐에 작업을 쌓지도 않는다. 대신에 작업 요청이 오면 초과 스레드로 작업을 바로바로 처리한다. 따라서 빠른 처리가 가능하다. 초과 스레드의 수도 제한이 없기 때문에, CPU, 메모리 자원만 허용한다면 시스템의 자원을 최대로 사용할 수 있다.
- 결과적으로 이 전략의 모든 작업은 초과 스레드가 담당한다.
추가로 초과 스레드는 60초간 생존하기 때문에, 작업 수에 맞추어 적절한 수의 스레드가 재사용된다. 이런 특징 때문에, 요청이 갑자기 증가하면 스레드도 갑자기 증가하고, 요청이 줄어들면 스레드도 점점 줄어든다.
이 전략은 작업의 요청 수에 따라서 스레드도 증가하고 감소하므로, 매우 유연한 전략이다.

주의

이 방식은 작업 수에 맞추어 스레드 수가 변하기 때문에, 작업의 처리 속도가 빠르고, CPU, 메모리를 매우 유연하게 사용할 수 있다는 장점이 있다.
하지만 이는 가장 큰 단점이 되기도 한다.

상황1 - 점진적인 사용자 확대

개발한 서비스가 잘 되어서 사용자가 점점 늘어난다.
캐시 스레드 전략을 사용하면 이런 경우 크게 문제가 되지 않는다.
캐시 스레드 전략은 이런 경우에는 문제를 빠르게 찾을 수 있다. 사용자가 점점 증가하면서 스레드 사용량도 함께 늘어난다.
따라서 CPU 메모리의 사용량도 자연스럽게 증가한다. 물론 CPU, 메모리 자원은 한계가 있기 때문에 적절한 시점에 시스템을 증설해야 한다. 그렇지 않으면 CPU, 메모리 같은 시스템 자원을 너무 많이 사용하면서 시스템이 다운될 수 있다.

상황2 - 갑작스런 요청 증가

마케팅 팀의 이벤트가 대성공 하면서 갑자기 사용자가 폭증했다.
고객은 응답을 받지 못한다고 항의한다.

상황2 - 확인

개발자는 급하게 CPU, 메모리 사용량을 확인해보는데, CPU 사용량이 100%이고, 메모리 사용량도 지나치게 높아져있다.
스레드 수를 확인해보니 스레드(스레드는 한개당 1MB 이상)가 수 천개 실행되고 있다. 너무 많은 스레드가 작업을 처리하면서 시스템 전체가 느려지는 현상이 발생한다.
캐시 스레드 풀 전략은 스레드가 무한으로 생성될 수 있다.
수 천개의 스레드가 처리하는 속도 보다 더 많은 작업이 들어온다.
시스템은 너무 많은 스레드에 잠식 당해서 거의 다운된다. 메모리도 거의 다 사용되어 버린다.
시스템이 멈추는 장애가 발생한다.

고정 스레드 풀 전략은 서버 자원은 여유가 있는데, 사용자만 점점 느려지는 문제가 발생할 수 있다.

반면 캐시 스레드 풀 전략은 서버의 자원을 최대로 사용하지만, 서버가 감당할 수 있는 임계점을 넘는 순간 시스템이 다운될 수 있다.

Executor 전략 - 사용자 정의 풀 전략

상황1 - 점진적인 사용자 확대

개발한 서비스가 잘 되어서 사용자가 점점 늘어난다.

상황2 - 갑작스런 요청 증가

마케팅 팀의 이벤트가 대성공 하면서 갑자기 사용자가 폭증했다.

다음과 같이 세분화된 전략을 사용하면 상황1, 상황2를 모두 어느정도 대응할 수 있다.

일반: 일반적인 상황에는 CPU, 메모리 자원을 예측할 수 있도록 고정 크기의 스레드로 서비스를 안정적으로 운영한다.
긴급: 사용자의 요청이 갑자기 증가하면 긴급하게 스레드를 추가로 투입해서 작업을 빠르게 처리한다.
거절: 사용자의 요청이 폭증해서 긴급 대응도 어렵다면 사용자의 요청을 거절한다.

이 방법은 평소에는 안정적으로 운영하다가, 사용자의 요청이 갑자기 증가하면 긴급하게 스레드를 더 투입해서 급한 불을 끄는 방법이다. 물론 긴급 상황에는 CPU, 메모리 자원을 더 사용하기 때문에 적정 수준을 찾아야 한다. 일반적으로는 여기까지 대응이 되겠지만, 시스템이 감당할 수 없을 정도로 사용자의 요청이 폭증하면, 처리 가능한 수준의 사용자 요청만 처리하고 나머지 요청을 거절해야 한다. 어떤 경우에도 시스템이 다운되는 최악의 상황은 피해야 한다.

ExecutorService es = new ThreadPoolExecutor(100, 200, 
                                60, TimeUnit.SECONDS, new ArrayBlockingQueue<>(1000));

100개의 기본 스레드를 사용한다.
추가로 긴급 대응 가능한 긴급 스레드 100개를 사용한다. 긴급 스레드는 60초의 생존 주기를 가진다.
1000개의 작업이 큐에 대기할 수 있다.

package thread.executor.poolsize;

import thread.executor.RunnableTask;

import java.util.concurrent.*;

import static thread.executor.ExecutorUtils.printState;
import static util.MyLogger.log;

public class PoolSizeMainV4 {

//    static final int TASK_SIZE = 1100;  // 1. 일반
//    static final int TASK_SIZE = 1200;  // 2. 긴급
    static final int TASK_SIZE = 1201;  // 3. 거절

    public static void main(String[] args) {
        ExecutorService es = new ThreadPoolExecutor(100, 200,
                                60, TimeUnit.SECONDS,
                                new ArrayBlockingQueue<>(1000));
        printState(es);

        long startMs = System.currentTimeMillis();
        for (int i = 0; i < TASK_SIZE; i++) {
            String taskName = "task" + i;
            try{
                es.execute(new RunnableTask(taskName));
                printState(es, taskName);
            } catch (RejectedExecutionException e){
                log(taskName + " -> " + e);
            }
        }

        es.close();
        long endMs = System.currentTimeMillis();
        log("time : " + (endMs - startMs));
    }
}

일반 - TASK_SIZE = 1100

1000개 이하의 작업이 큐에 담겨 있다. -> 100개의 기본 스레드가 처리한다.
최대 1000개의 작업이 큐에 대기하고 100개의 작업이 실행중일 수 있다. 따라서 1100개 까지는 기본 스레드로 처리할 수 있다.

긴급 - TASK_SIZE = 1200

큐에 담긴 작업이 1000개를 초과한다. -> 100개의 기본 스레드 + 100개의 초과 스레드가 처리한다.
최대 1000개의 작업이 대기하고 200개의 작업이 실행중일 수 있다.
작업을 모두 처리하는데 6초가 걸린다. 1200 / 200 -> 6초
긴급 투입한 스레드 덕분에 풀의 스레드 수가 2배가 된다. 따라서 작업을 2배 빠르게 처리한다.
물론 CPU, 메모리 사용을 더 하기 때문에, 이런 부분은 감안해서 긴급 상황에 투입할 최대 스레드를 정해야 한다.

거절 - TASK_SIZE = 1201

중간에 task1201 예외 로그를 잘 확인해야 한다.
긴급 투입한 스레드로도 작업이 빠르게 소모되지 않는다는 것은, 시스템이 감당하기 어려운 많은 요청이 들어오고 있다는 의미이다.
여기서는 큐에 대기하는 작업 1000개 + 스레드가 처리 중인 작업 200개 -> 총 1200개의 작업을 초과하면 예외가 발생한다.
따라서 1201번에서 예외가 발생한다.
이런 경우 요청을 거절한다. 고객 서비스라면 시스템에 사용자가 너무 많으니 나중에 다시 시도해달라고 해야 한다.
나머지 1200개의 작업들은 긴급 상황과 같이 정상 처리된다.

실무에서 자주하는 실수

참고 - 만약 다음과 같이 설정하면?

ExecutorService es = new ThreadPoolExecutor(100, 200, 
                                60, TimeUnit.SECONDS, new LinkedBlockingQueue<>());

기본 스레드 100개
최대 스레드 200개
큐 사이즈 : 무한대

이렇게 설정하면 절대로 최대 사이즈만큼 늘어나지 않는다. 왜냐하면 큐가 가득차야 긴급 상황으로 인지 되는데, LinkedBlockingQueue 를 기본 생성자를 통해 무한대의 사이즈로 사용하게 되면, 큐가 가득찰 수 없다. 결국 기본 스레드 100개만으로 무한대의 작업을 처리해야 하는 문제가 발생한다.

실무에서 자주하는 실수 중 하나이다.

Executor 예외 정책

생산자 소비자 문제를 실무에서 사용할 때는, 결국 소비자가 처리할 수 없을 정도로 생산 요청이 가득 차면 어떻게 할지를 정해야 한다. 개발자가 인지할 수 있도록 로그도 남겨야 하고, 사용자에게 현재 시스템에 문제가 있다고 알리는 것도 필요하다. 이런 것을 위해 예외 정책이 필요하다.

ThreadPoolExecutor 에 작업을 요청할 때, 큐도 가득차고, 초과 스레드도 더는 할당할 수 없다면 작업을 거절한다.

ThreadPoolExecutor 는 작업을 거절하는 다양한 정책을 제공한다.

AbortPolicy : 새로운 작업을 제출할 때 RejectedExecutionException 을 발생시킨다. 기본 정책이다.
DiscardPolicy: 새로운 작업을 조용히 버린다.
CallerRunsPolicy: 새로운 작업을 제출한 스레드가 대신해서 직접 작업을 실행한다.
사용자 정의( RejectedExecutionHandler) : 개발자가 직접 정의한 거절 정책을 사용할 수 있다.

AbortPolicy

작업이 거절되면 `RejectedExecutionException` 을 던진다. 기본적으로 설정되어 있는 정책이다.

TheradPoolExecotor 생성자 마지막에 new ThreadPoolExecutor.AbortPolicy() 를 제공하면 된다.
참고로 이것이 기본 정책이기 때문에, 생략해도 된다.

package thread.executor.reject;

import thread.executor.RunnableTask;

import java.util.concurrent.RejectedExecutionException;
import java.util.concurrent.SynchronousQueue;
import java.util.concurrent.ThreadPoolExecutor;
import java.util.concurrent.TimeUnit;

import static util.MyLogger.log;

public class RejectMainV1 {
    public static void main(String[] args) {
        ThreadPoolExecutor executor = new ThreadPoolExecutor(1, 1,
                0, TimeUnit.SECONDS, new SynchronousQueue<>(), 
                new ThreadPoolExecutor.AbortPolicy());

        executor.submit(new RunnableTask("task1"));
        try{
            executor.submit(new RunnableTask("task2"));
        } catch (RejectedExecutionException e){
            log("요청 초과");
            log(e);
        }

        executor.close();
    }
}

RejextedExcecutionException 예외를 잡아서 포기하거나, 사용자에게 알리거나, 다시 시도하면 된다. 이렇게 예외를 잡아서 필요한 코드를 직접 구현해도 되고, 아니면 다음에 설명한 다른 정책들을 사용해도 된다.

RejectedExecutionHandler

마지막에 전달한 AbortPolicy 는 RejectedExecutionHandler 의 구현체이다. ThreadPoolExecutor 생성자는 RejectedExecutionHandler 의 구현체를 전달 받는다.

ThreadPoolExecutor 는 거절해야 하는 상황이 발생하면 여기에 있는 rejectedExecution() 을 호출한다.

AbortPolicy 는 RejectedExecutionException 을 던지는 것을 확인할 수 있다.

public interface RejectedExecutionHandler {
     void rejectedExecution(Runnable r, ThreadPoolExecutor executor);
}

public static class AbortPolicy implements RejectedExecutionHandler {

     public void rejectedExecution(Runnable r, ThreadPoolExecutor e) {
         throw new RejectedExecutionException("Task " + r.toString() +
                                               " rejected from " +
                                               e.toString());

     } 
}

DiscardPolicy

거절된 작업을 무시하고 아무런 예외도 발생시키지 않는다..

package thread.executor.reject;

import thread.executor.RunnableTask;

import java.util.concurrent.RejectedExecutionException;
import java.util.concurrent.SynchronousQueue;
import java.util.concurrent.ThreadPoolExecutor;
import java.util.concurrent.TimeUnit;

import static util.MyLogger.log;

public class RejectMainV2 {
    public static void main(String[] args) {
        ThreadPoolExecutor executor = new ThreadPoolExecutor(1, 1,
                0, TimeUnit.SECONDS, new SynchronousQueue<>(), 
                new ThreadPoolExecutor.DiscardPolicy());

        executor.submit(new RunnableTask("task1"));
        executor.submit(new RunnableTask("task2"));
        executor.submit(new RunnableTask("task3"));

        executor.close();
    }
}

다음 구현 코드를 보면 왜 조용히 버리는 정책인지 이해가 될 것이다.

public static class DiscardPolicy implements RejectedExecutionHandler {
    public void rejectedExecution(Runnable r, ThreadPoolExecutor e) {
    // empty
    }
}

CallerRunsPolicy

호출한 스레드가 직접 작업을 수행하게 한다. 이로 인해 새로운 작업을 제출하는 스레드의 속도가 느려질 수 있다.

package thread.executor.reject;

import thread.executor.RunnableTask;

import java.util.concurrent.SynchronousQueue;
import java.util.concurrent.ThreadPoolExecutor;
import java.util.concurrent.TimeUnit;

public class RejectMainV3 {
    public static void main(String[] args) {
        ThreadPoolExecutor executor = new ThreadPoolExecutor(1, 1,
                0, TimeUnit.SECONDS, new SynchronousQueue<>(), 
                new ThreadPoolExecutor.CallerRunsPolicy());

        executor.submit(new RunnableTask("task1"));
        executor.submit(new RunnableTask("task2"));
        executor.submit(new RunnableTask("task3"));
        executor.submit(new RunnableTask("task4"));

        executor.close();
    }
}

task1 은 스레드 풀에 스레드가 있어서 수행한다.
task2 는 스레드 풀에 보관할 큐도 없고, 작업할 스레드가 없다. 거절해야 한다.
이때 작업을 거절하는 대신에, 작업을 요청한 스레드에 대신 일을 시킨다.
task2 작업을 main 스레드가 수행하는 것을 확인할 수 있다.

이 정책의 특징은 생산자 스레드가 소비자 대신 일을 수행해주는 것도 있지만, 생산자 대신 일을 수행하는 덕분에 작업의 생산 자체가 느려진다는 점이다. 덕분에 작업의 생산 속도가 너무 빠르다면, 생산 속도를 조절할 수 있다.

원래대로 하면 main 스레드가 task1, task2, task3, task4 를 연속해서 바로 생산해야 한다.

CallerRunPolicy 정책 덕분에 main 스레드는 task2 를 본인이 직접 완료하고 나서야 task3 을 생산할 수 있다. 결과적으로 생산 속도가 조절되었다.

public static class CallerRunsPolicy implements RejectedExecutionHandler {
     public void rejectedExecution(Runnable r, ThreadPoolExecutor e) {
         if (!e.isShutdown()) {
             r.run();
         } 
    }
}

사용자 정의 (RejectedExecutionHandler)

사용자가 원하는 예외 정책을 만들어보자.

거절된 작업을 버리지만, 대신에 경고 로그를 남겨서 개발자가 문제를 인지할 수 있도록 해보자.

package thread.executor.reject;

import thread.executor.RunnableTask;

import java.util.concurrent.RejectedExecutionHandler;
import java.util.concurrent.SynchronousQueue;
import java.util.concurrent.ThreadPoolExecutor;
import java.util.concurrent.TimeUnit;
import java.util.concurrent.atomic.AtomicInteger;

import static util.MyLogger.log;

public class RejectMainV4 {
    public static void main(String[] args) {
        ThreadPoolExecutor executor = new ThreadPoolExecutor(1, 1,
                0, TimeUnit.SECONDS, new SynchronousQueue<>(), 
                new MyRejectedExecutionHandler());

        executor.submit(new RunnableTask("task1"));
        executor.submit(new RunnableTask("task2"));
        executor.submit(new RunnableTask("task3"));
        executor.submit(new RunnableTask("task4"));

        executor.close();
    }

    static class MyRejectedExecutionHandler implements RejectedExecutionHandler {

        static AtomicInteger count = new AtomicInteger(0);

        @Override
        public void rejectedExecution(Runnable r, ThreadPoolExecutor executor) {
            int i = count.incrementAndGet();
            log("[경고] 누적된 거절 수 : " + i);
        }
    }
}

정리

고정 스레스 풀 전략 : 트래픽이 일정하고, 시스템 안정성이 가장 중요
캐시 스레드 풀 전략 : 일반적인 성장하는 서비스
사용자 정의 풀 전략 : 다양한 상황에 대응

가장 좋은 최적화는 최적화하지 않는 것이다.

많은 개발자가 미래에 발생하지 않을 일 때문에 코드를 최적화하는 경우가 많다. 예를 들어, 초기 서비스이고, 아직 사용자가많을지 예측이 되지 않는 상황인데, 코드 최적화에 너무 많은 시간을 사용할 수 있다. 이것은 사용자는 얼마 없는데 매우 비싼 서버를 구매하는 것과 같다. 물론 이 이야기가 극단적으로 최적화를 하지 말자는 말이 아니다.

예를 들어, A 와 관련된 기능을 매우 많이 최적화 했는데, 사용자가 없어서 결국 버리게 되는 경우가 있다. 반면에 별로 신경쓰지 않는 B 와 관련된 기능에 사용자가 많이 늘어날 수 있다.

중요한 것은 예측 불가능한 너무 먼 미래 보다는 현재 상황에 맞는 최적화가 필요하다는 점이다. 시스템의 상황을 잘 모니터링하고 있다가, 최적화가 필요한 부분들이 발생하면, 그때 필요한 부분들을 개선하는 것이다.

우리가 만든 서비스가 잘 되어서 많은 요청이 들어오면 좋겠지만, 대부분의 서비스는 트래픽이 어느정도 예측 가능하다. 그리고 성장하는 서비스라도 어느정도 성장이 예측 가능하다.

그래서 일반적인 상황이라면 고정 스레드 풀 전략이나, 캐시 스레드 풀 전략을 사용하면 충분하다. 한번에 처리할 수 있는 수를 제안하고 안정적으로 처리하고 싶다면 고정 풀 전략을 사용하고, 사용자의 요청을 빠르게 대응하고 싶다면 캐시 스레드 풀 전략을 사용하면 된다. 물론 자원만 충분하다면 고정 풀 전략을 선택하면서 풀의 수를 많이 늘려서 사용자의 요청도 빠르게 대응하면서 안정적인 서비스 운영도 가능하다. 그러다가 일반적인 상황을 벗어날 정도로 서비스가 잘 운영되면 그때 더 나은 최적화 받법을 선택하면 된다.

백엔드 서버 개발자라면 시스템의 자원을 적절하게 사용하되, 최악의 경우 적절한 거절을 통해 시스템이 다운되지 않도록 해야 한다.

Previous스레드 풀과 Executor 프레임워크1 Next김영한의 실전 자바 - 고급 2편, I/O, 네트워크, 리플렉션

Last updated 8 months ago

hashtagExecutorService 우아한 종료 - 소개

hashtagExecutorService 의 종료 메서드

hashtag서비스 종료

hashtag서비스 상태 확인

hashtag작업 완료 대기

hashtagclose()

hashtagExecutorService 우아한 종료 - 구현

hashtagclose()

hashtag코드 분석

hashtag작업 처리에 필요한 시간

hashtag서비스 종료

hashtag서비스 정상 종료 실패 -> 강제 종료 시도

hashtag서비스 종료 실패

hashtag인터럽트를 받을수 없는 코드

hashtagExecutor 스레드 풀 관리 - 코드

hashtag예제

hashtag실행 결과

hashtagExecutor 스레드 풀 관리 - 분석

hashtag실행 분석

hashtagExecutor 전략 - 고정 풀 전략

hashtagExecutor 스레드 풀 관리 - 다양한 전략

hashtagnewSingleThreadPool() : 단일 스레드 풀 전략

hashtagExecutor 스레드 풀 관리 - 고정 풀 전략

hashtagnewFixedThreadPool(nThreads)

hashtag특징

hashtag주의

hashtag상황1 - 점진적인 사용자 확대

hashtag상황2 - 갑작스런 요청 증가

hashtag확인

hashtagExecutor 전략 - 캐시 풀 전략

hashtagnewCachedThreadPool()

hashtagSynchronousQueue 는 아주 특별한 블로킹 큐이다.

hashtagSynchronousQueue 의 단점은 무엇일까?

hashtag생산자/소비자 수가 비동기적으로 불균형하면, put() 또는 take()가 블로킹된다.

hashtagSynchronousQueue 를 언제 사용하면 좋을까?

hashtag특징

hashtag주의

hashtag상황1 - 점진적인 사용자 확대

hashtag상황2 - 갑작스런 요청 증가

hashtag상황2 - 확인

hashtagExecutor 전략 - 사용자 정의 풀 전략

hashtag다음과 같이 세분화된 전략을 사용하면 상황1, 상황2를 모두 어느정도 대응할 수 있다.

hashtag일반 - TASK_SIZE = 1100

hashtag긴급 - TASK_SIZE = 1200

hashtag거절 - TASK_SIZE = 1201

hashtag실무에서 자주하는 실수

hashtag참고 - 만약 다음과 같이 설정하면?

hashtagExecutor 예외 정책

hashtagAbortPolicy

hashtag작업이 거절되면 RejectedExecutionException 을 던진다. 기본적으로 설정되어 있는 정책이다.

hashtagRejectedExecutionHandler

hashtagDiscardPolicy

hashtag다음 구현 코드를 보면 왜 조용히 버리는 정책인지 이해가 될 것이다.

hashtagCallerRunsPolicy

hashtag사용자 정의 (RejectedExecutionHandler)

hashtag정리

hashtag가장 좋은 최적화는 최적화하지 않는 것이다.

ExecutorService 우아한 종료 - 소개

ExecutorService 의 종료 메서드

서비스 종료

서비스 상태 확인

작업 완료 대기

close()

ExecutorService 우아한 종료 - 구현

close()

코드 분석

작업 처리에 필요한 시간

서비스 종료

서비스 정상 종료 실패 -> 강제 종료 시도

서비스 종료 실패

인터럽트를 받을수 없는 코드

Executor 스레드 풀 관리 - 코드

예제

실행 결과

Executor 스레드 풀 관리 - 분석

실행 분석

Executor 전략 - 고정 풀 전략

Executor 스레드 풀 관리 - 다양한 전략

newSingleThreadPool() : 단일 스레드 풀 전략

Executor 스레드 풀 관리 - 고정 풀 전략

newFixedThreadPool(nThreads)

특징

주의

상황1 - 점진적인 사용자 확대

상황2 - 갑작스런 요청 증가

확인

Executor 전략 - 캐시 풀 전략

newCachedThreadPool()

SynchronousQueue 는 아주 특별한 블로킹 큐이다.

SynchronousQueue 의 단점은 무엇일까?

생산자/소비자 수가 비동기적으로 불균형하면, `put()` 또는 `take()`가 블로킹된다.

`SynchronousQueue` 를 언제 사용하면 좋을까?

특징

주의

상황1 - 점진적인 사용자 확대

상황2 - 갑작스런 요청 증가

상황2 - 확인

Executor 전략 - 사용자 정의 풀 전략

다음과 같이 세분화된 전략을 사용하면 상황1, 상황2를 모두 어느정도 대응할 수 있다.

일반 - TASK_SIZE = 1100

긴급 - TASK_SIZE = 1200

거절 - TASK_SIZE = 1201

실무에서 자주하는 실수

참고 - 만약 다음과 같이 설정하면?

Executor 예외 정책

AbortPolicy

작업이 거절되면 `RejectedExecutionException` 을 던진다. 기본적으로 설정되어 있는 정책이다.

RejectedExecutionHandler

DiscardPolicy

다음 구현 코드를 보면 왜 조용히 버리는 정책인지 이해가 될 것이다.

CallerRunsPolicy

사용자 정의 (RejectedExecutionHandler)

정리

가장 좋은 최적화는 최적화하지 않는 것이다.