5. 컬렉션 프레임워크 - List

리스트 추상화1 - 인터페이스 도입

List 자료구조

순서가 있고, 중복을 허용하는 자료구조를 리스트라고 한다.

우리가 지금까지 만든 MyArrayList 와 MyLinkedList 는 내부 구현만 다를 뿐 같은 기능을 제공하는 리스트이다. 물론 내부 구현이 다르기 때문에 상황에 따라 성능은 달라질 수 있다. 핵심은 사용자 입장에서 보면 같은 기능을 제공한다는 것이다.

이 둘의 공통 기능을 인터페이스로 뽑아서 추상화하면 다형성을 활용한 다양한 이득을 얻을 수 있다.

같은 기능을 제공하는 메서드를 MyList 인터페이스로 뽑아보자.

MyArrayList, MyLinkedList 모두 메서드 이름이 같기 때문에, 오류가 발생하지 않는다.
추가로 재정의한 메서드에 @Override 애노테이션도 넣어주자

package collection.list;

public interface MyList<E> {

    int size();

    void add(E e);

    void add(int index, E e);

    E get(int index);

    E set(int index, E elememt);

    E remove(int index);

    int indexOf(E o);
}

package collection.list;

import java.util.Arrays;

public class MyArrayList<E> implements MyList<E> {
    //...
}

package collection.list;

public class MyLinkedList<E> implements MyList<E> {
      //...
}

리스트 추상화2 - 의존관계 주입

MyArrayList 를 활용해서 많은 데이터를 처리하는 BatchProcessor 클래스를 개발하고 있다고 가정하자. 그런데, 막상 프로그램을 개발하고 보니 데이터를 앞에서 추가하는 일이 많은 상황이라고 가정해보자.

데이터를 앞에서 추가 하거나 삭제하는 일이 많다면 MyArrayList 보다는 MyLinkedList 를 사용하는 것이 훨씬 효율적이다.

데이터를 앞에서 추가하거나 삭제할 때 빅오 비교

MyArrayList : O(n)
MyLinkedList : O(1)

구체적인 MyArrayList 에 의존하는 BatchProcessor 예시

MyArrayList를 사용해보니 성능이 너무 느려서 MyLinkedList를 사용하도록 코드를 변경해야 한다면 BatchProcessor의 내부 코드도 MyArrayList 에서 MyLinkedList 를 사용하도록 함께 변경해야 한다.
BatchProcessor 는 구체적인 MyArrayList 또는 MyLinkedList 를 사용하고 있다. 이것을 BatchProcessor 가 구체적인 클래스에 의존한다고 표현한다.
이렇게 구체적인 클래스에 직접 의존하면MyArrayList 를 MyLinkedList 로 변경할 때 마다 여기에 의존하는 BatchProcessor 의 코드도 함께 수정해야 한다.

public class BatchProcessor {

      private final MyArrayList<Integer> list = new MyArrayList<>(); 
      // private final MyLinkedList<Integer> list = new MyLinkedList<>(); //코드 변경
      
      public void logic(int size) {
            for (int i = 0; i < size; i++) {
                  list.add(0, i); //앞에 추가 
            }
      }
}

추상적인 MyList에 의존하는 BatchProcessor 예시

BatchProcessor 를 생성하는 시점에 생성자를 통해 원하는 리스트 전략(알고리즘)을 선택해서 전달하면 된다.
이렇게 하면 MyList 를 사용하는 클라이언트 코드인 BatchProcessor 를 전혀 변경하지 않고, 원하는 리스트 전략을 런타임에 지정할 수 있다.
정리하면, 다형성과 추상화를 활용하면 BatchProcessor 코드를 전혀 변경하지 않고 리스트 전략(알고리즘)을 MyArrayList 에서 MyLinkedList 로 변경할 수 있다.
이것은 BatchProcessor 의 외부에서 의존관계가 결정되어서 BatchProcessor 인스턴스에 들어오는 것 같다. 마치 의존관계가 외부에서 주입되는 것 같다고 해서 이것을 의존관계 주입(Dependency Injection, DI)이라 한다.
참고로 생성자를 통해서 의존관계를 주입했기 때문에 생성자 의존관계 주입이라 한다.

public class BatchProcessor {

      private final MyList<Integer> list;
      
      public BatchProcessor(MyList<Integer> list) {
          this.list = list;
      }
      
      public void logic(int size) {
          for (int i = 0; i < size; i++) {
              list.add(0, i); //앞에 추가 
          }
      
}
}

main() {
    new BatchProcessor(new MyArrayList()); //MyArrayList를 사용하고 싶을 때 
    new BatchProcessor(new MyLinkedList()); //MyLinkedList를 사용하고 싶을 때
}

리스트 추상화3 - 컴파일 타임, 런타임 의존관계

의존관계는 크게 컴파일 타임 의존관계, 런타임 의존관계로 나눌 수 있다.

컴파일 타임 : 코드 컴파일 시점
런타임 : 프로그램 실행 시점

컴파일 타임 의존관계 vs 런타임 의존관계

컴파일 타임 의존관계

컴파일 타임 의존관계는 자바 컴파일러가 보는 의존관계이다. 클래스에 모든 의존관계가 다 나타난다.
쉽게 이야기해서 클래스에 바로 보이는 의존관계이다. 그리고 실행하지 않은 소스 코드에 정적으로 나타나는 의존 관계이다.
BatchProcessor 클래스를 보면 MyList 인터페이스만 사용한다. 코드 어디에도 MyArrayList or MyLinkedList 같은 정보는 보이지 않는다. 따라서 BatchProcessor 는 MyList 인터페이스에만 의존한다.

런타임 의존관계

런타임 의존관계는 실제 프로그램이 작동할 때 보이는 의존관계다. 주로 생성된 인스턴스와 그것을 참조하는 의존 관계이다.
쉽게 이야기해서 프로그램이 실행될 때 인스턴스 간에 의존관계로 보면 된다.
런타임 의존관계는 프로그램 실행 중에 계속 변할 수 있다.

정리

MyList 인터페이스의 도입으로 같은 리스트 자료구조를 사용하면서 원하는 구현을 변경할 수 있게 되었다.
BatchProcessor 에서 다음과 같이 처음부터 MyArrayList 를 사용하도록 컴파일 타임 의존관계를 지정했
다면, 이후에 MyLinkedList 로 수정하기 위해서는 BatchProcessor 의 코드를 변경해야 한다.

public class BatchProcessor {
    private final MyArrayList<Integer> list = new MyArrayList(); //코드 변경 필요
}

BatchProcessor 클래스는 구체적인 MyArrayList 나 MyLinkedList 에 의존하는 것이 아니라 추상적인 MyList 에 의존한다. 따라서 런타임에 MyList 의 구현체를 얼마든지 선택할 수 있다.
BatchProcessor 에서 사용하는 리스트의 의존관계를 클래스에서 미리 결정하는 것이 아니라, 런타임에 객체를 생성하는 시점으로 미룬다. 따라서 런타임에 MyList 의 구현체를 변경해도 BatchProcessor 의 코드는 전혀 변경하지 않아도 된다.
이렇게 생성자를 통해 런타임 의존관계를 주입하는 것을 생성자 의존관계 주입 또는 줄여서 생성자 주입이라 한 다.
클라이언트 클래스는 컴파일 타임에 추상적인 것에 의존하고, 런타임에 의존 관계 주입을 통해 구현체를 주입받아 사용함으로써, 유지보수의 이점을 얻을 수 있다.

직접 구현한 리스트의 성능 비교

직접 만든 배열 리스트와 연결 리스트 - 성능 비교 표

추가, 삭제

배열 리스트는 인덱스를 통해 추가나 삭제할 위치를 O(1)로 빠르게 찾지만, 추가나 삭제 이후에 데이터를 한칸씩 밀어야 한다. 이 부분이 O(n)으로 오래 걸린다.
연결 리스트는 인덱스를 통해 추가나 삭제할 위치를 O(n)으로 느리게 찾지만, 실제 데이터의 추가는 간단한 참조 변경으로 빠르게 O(1)로 수행된다.

앞에 추가(삭제)

배열 리스트: 추가나 삭제할 위치는 찾는데 O(1), 데이터를 한칸씩 이동 O(n) -> O(n)
연결 리스트: 추가나 삭제할 위치는 찾는데 O(1), 노드를 변경하는데 O(1) -> O(1)

평균 추가(삭제)

배열 리스트: 추가나 삭제할 위치는 찾는데 O(1), 인덱스 이후의 데이터를 한칸씩 이동 O(n/2) -> O(n)
연결 리스트: 추가나 삭제할 위치는 찾는데 O(n/2), 노드를 변경하는데 O(1) -> O(n)

뒤에 추가(삭제)

배열 리스트: 추가나 삭제할 위치는 찾는데 O(1), 이동할 데이터 없음 O(1) -> O(1)
연결 리스트: 추가나 삭제할 위치는 찾는데 O(n), 노드를 변경하는데 O(1) -> O(n)

인덱스 조회

배열 리스트: 배열에 인덱스를 사용해서 값을 O(1)로 찾을 수 있음
연결 리스트: 노드를 인덱스 수 만큼 이동해야함 O(n)

검색

배열 리스트: 데이터를 찾을 때 까지 배열을 순회 O(n)
연결 리스트: 데이터를 찾을 때 까지 노드를 순회 O(n)

시간 복잡도와 실제 성능

이론적으로 MyLinkedList 의 평균 추가(중간 삽입) 연산은 MyArrayList 보다 빠를 수 있다.
그러나 실제 성능은 요소의 순차적 접근 속도, 메모리 할당 및 해제 비용, CPU 캐시 활용도 등 다양한 요소에 의해 영향을 받는다.
MyArrayList 는 요소들이 메모리 상에서 연속적으로 위치하여 CPU 캐시 효율이 높고, 메모리 접근 속도가 빠르다.
반면에, MyLinkedList 는 각 요소가 별도의 객체로 존재하고 다음 요소의 참조를 저장하기 때문에, CPU 캐시 효율이 떨어지고, 메모리 접근 속도가 상대적으로 느릴 수 있다.
MyArrayList 의 경우 CAPACITY 를 넘어서면 배열을 다시 만들고 복사하는 과정이 추가되지만 한번에 2배씩 늘어나기 때문에, 이 과정을 가끔씩 발생한다. (전체 성능에 큰 영향을 주지 않는다)

정리하면, 이론적으로는 MyLinkedList 가 평균 추가(중간 삽입) 에 있어서 더 효율적일 수 있지만, 현대 컴퓨터 시스템의 메모리 접근 패턴, CPU 캐시 최적화 등을 고려할 때 MyArrayList 가 실제 사용 환경에서 더 나은 성능을 보여주는 경우가 많다.

배열 리스트 vs 연결 리스트

대부분의 경우 배열 리스트가 성능상 유리하다. 이런 이유로 실무에서는 주로 배열 리스트를 기본으로 사용한다. 만약 데이터를 앞쪽에서 자주 추가하거나 삭제할 일이 있다면 연결 리스트를 고려하자.

자바 리스트

List 자료 구조

순서가 있고, 중복을 허용하는 자료 구조를 리스트라 한다. 자바의 컬렉션 프레임워크가 제공하는 가장 대표적인 자료 구조가 바로 리스트이다. 리스트와 관련된 컬렉션 프레임워크는 다음 구조를 가진다.

컬렉션 프레임워크 - 리스트

Collection 인터페이스

Collection 인터페이스는 java.util 패키지의 컬렉션 프레임워크의 핵심 인터페이스 중 하나이다.

이 인터페이스는 자바에서 다양한 컬렉션, 즉 데이터 그룹을 다루기 위한 메서드를 정의한다. Collection 인터페이스는 List , Set , Queue 와 같은 다양한 하위 인터페이스와 함께 사용되며, 이를 통해 데이터를 리스트, 세트, 큐 등의 형태로 관리할 수 있다. 자세한 내용은 뒤에서 다룬다.

List 인터페이스 `List` 인터페이스는 `java.util` 패키지에 있는 컬렉션 프레임워크의 일부다.

`List` 는 객체들의 순서가 있는 컬렉션을 나타내며, 같은 객체의 중복 저장을 허용한다. 이 리스트는 배열과 비슷하지만, 크기가 동적으로 변화하는 컬렉션을 다룰 때 유연하게 사용할 수 있다.

List 인터페이스는 ArrayList , LinkedList 와 같은 여러 구현 클래스를 가지고 있으며, 각 클래스는 List 인 터페이스의 메서드를 구현한다.

자바 ArrayList

java.util.ArrayList 자바가 제공하는 ArrayList 는 우리가 직접 만든 MyArrayList 와 거의 비슷하다. 특징은 다음과 같다.

자바 ArrayList의 특징

배열을 사용해서 데이터를 관리한다.
기본 CAPACITY 는 10이다.( DEFAULT_CAPACITY = 10 )
- CAPACITY 를 넘어가면 배열을 50% 증가한다.
- 10 15 22 33 49로 증가한다. (최적화는 자바 버전에 따라 달라질 수 있다.)
메모리 고속 복사 연산을 사용한다.
- ArrayList 의 중간 위치에 데이터를 추가하면, 추가할 위치 이후의 모든 요소를 한 칸씩 뒤로 이동시켜야 한다.
- 자바가 제공하는 ArrayList 는 이 부분을 최적화 하는데, 배열의 요소 이동은 시스템 레벨에서 최적화된 메모리 고속 복사 연산을 사용해서 비교적 빠르게 수행된다. (참고로 System.arraycopy() 를 사용한다)
  - 일반적인 복사 연산은 하나의 요소마다 복사를 한다.
  - System.arraycopy() 는 ArrayList 가 연속된 메모리를 가졌다는 특징을 사용해 메모리 블럭 단위로 복사한다.

데이터 추가 - 메모리 고속 복사 연산 사용

시스템 레벨에서 배열을 한 번에 아주 빠르게 복사한다.
이 부분은 OS, 하드웨어에 따라 성능이 다르기 때문에, 정확한 측정이 어렵지만, 한 칸씩 이동하는 방식(MyArrayList 방식) 과 비교하면 보통 수 배 이상의 빠른 성능을 제공한다.

자바 LinkedList

java.util.LinkedList 자바가 제공하는 LinkedList 는 우리가 직접 만든 MyLinkedList 와 거의 비슷하다. 특징은 다음과 같다.

자바의 LinkedList 특징

이중 연결 리스트 구조
첫 번째 노드와 마지막 노드 둘다 참조

이중 연결 리스트

자바가 제공하는 LinkedList 는 이중 연결 구조를 사용한다. 이 구조는 다음 노드 뿐만 아니라 이전 노드로도 이동할 수 있다.
- 예) node.next 를 호출하면 다음 노드로, node.prev 를 호출하면 이전 노드로 이동한다.
마지막 노드에 대한 참조를 제공한다. 따라서 데이터를 마지막에 추가하는 경우에도 O(1)의 성능을 제공한다.
이전 노드로 이동할 수 있기 때문에 마지막 노드부터 앞으로, 그러니까 역방향으로 조회할 수 있다.
- 덕분에 인덱스 조회 성능을 최적화 할 수 있다.
- 예를 들어 인덱스로 조회하는 경우 인덱스가 사이즈의 절반 이하라면 처음부터 찾아서 올라가고, 인덱스가 사이즈의 절반을 넘으면 마지막 노드 부터 역방향으로 조회해서 성능을 최적화 할 수 있다.

자바 리스트의 성능 비교

직접 만든 배열 리스트와 연결 리스트 - 성능 비교 표

자바가 제공하는 배열 리스트와 연결 리스트 - 성능 비교 표

데이터를 추가할 때 자바 ArrayList가 직접 구현한 MyArrayList보다 빠른 이유

자바의 배열 리스트는 이때 메모리 고속 복사를 사용하기 때문에 성능이 최적화된다.
메모리 고속 복사는 시스템에 따라 성능이 다르기 때문에 정확한 계산은 어렵지만 대략 O(n/10) 정도로 추정하자. (상수를 제거하면 O(n)이 된다)
하지만 메모리 고속 복사라도 데이터가 아주 많으면 느려진다.

시간 복잡도와 실제 성능

이론적으로 LinkedList 의 중간 삽입 연산은 ArrayList 보다 빠를 수 있다.
그러나 실제 성능은 요소의 순차적 접근 속도, 메모리 할당 및 해제 비용, CPU 캐시 활용도 등 다양한 요소에 의해 영향을 받는다.
추가로 ArrayList 는 데이터를 한 칸씩 직접 이동하지 않고, 대신에 메모리 고속 복사를 사용한다. ArrayList 는 요소들이 메모리 상에서 연속적으로 위치하여 CPU 캐시 효율이 좋고, 메모리 접근 속도가 빠르다.
반면, LinkedList 는 각 요소가 별도의 객체로 존재하고 다음 요소의 참조를 저장하기 때문에 CPU 캐시 효율이 떨어지고, 메모리 접근 속도가 상대적으로 느려질 수 있다.
ArrayList 의 경우 CAPACITY 를 넘어서면 배열을 다시 만들고 복사하는 과정이 추가된다. 하지만 한번에 50%씩 늘어나기 때문에 이 과정은 가끔 발생하므로, 전체 성능에 큰 영향을 주지는 않는다.

정리하면 이론적으로 LinkedList 가 중간 삽입에 있어 더 효율적일 수 있지만, 현대 컴퓨터 시스템의 메모리 접근 패턴, CPU 캐시 최적화, 메모리 고속복사 등을 고려할 때 ArrayList 가 실제 사용 환경에서 더 나은 성능을 보여주는 경우가 많다.

배열 리스트 vs 연결 리스트

대부분의 경우 배열 리스트가 성능상 유리하다.

이런 이유로 실무에서는 주로 배열 리스트를 기본으로 사용한다. 만약 데이터를 앞쪽에서 자주 추가하거나 삭제할 일이 있다면 연결 리스트를 고려하자.

Previous4. 컬렉션 프레임워크 - LinkedList Next6. 컬렉션 프레임워크 - 해시(Hash)

Last updated 5 months ago

hashtag리스트 추상화1 - 인터페이스 도입

hashtagList 자료구조

hashtag리스트 추상화2 - 의존관계 주입

hashtag데이터를 앞에서 추가하거나 삭제할 때 빅오 비교

hashtag구체적인 MyArrayList 에 의존하는 BatchProcessor 예시

hashtag추상적인 MyList에 의존하는 BatchProcessor 예시

hashtag리스트 추상화3 - 컴파일 타임, 런타임 의존관계

hashtag컴파일 타임 의존관계 vs 런타임 의존관계

hashtag컴파일 타임 의존관계

hashtag런타임 의존관계

hashtag정리

hashtag직접 구현한 리스트의 성능 비교

hashtag직접 구현한 리스트의 성능 비교

hashtag직접 만든 배열 리스트와 연결 리스트 - 성능 비교 표

hashtag추가, 삭제

hashtag앞에 추가(삭제)

hashtag평균 추가(삭제)

hashtag뒤에 추가(삭제)

hashtag인덱스 조회

hashtag검색

hashtag시간 복잡도와 실제 성능

hashtag배열 리스트 vs 연결 리스트

hashtag자바 리스트

hashtagList 자료 구조

hashtag컬렉션 프레임워크 - 리스트

hashtagCollection 인터페이스

hashtagList 인터페이스 List 인터페이스는 java.util 패키지에 있는 컬렉션 프레임워크의 일부다.

hashtagList 는 객체들의 순서가 있는 컬렉션을 나타내며, 같은 객체의 중복 저장을 허용한다. 이 리스트는 배열과 비슷하지만, 크기가 동적으로 변화하는 컬렉션을 다룰 때 유연하게 사용할 수 있다.

hashtag자바 ArrayList

hashtag자바 ArrayList의 특징

hashtag데이터 추가 - 메모리 고속 복사 연산 사용

hashtag자바 LinkedList

hashtag자바의 LinkedList 특징

hashtag이중 연결 리스트

hashtag자바 리스트의 성능 비교

hashtag직접 만든 배열 리스트와 연결 리스트 - 성능 비교 표

hashtag자바가 제공하는 배열 리스트와 연결 리스트 - 성능 비교 표

hashtag데이터를 추가할 때 자바 ArrayList가 직접 구현한 MyArrayList보다 빠른 이유

hashtag시간 복잡도와 실제 성능

hashtag배열 리스트 vs 연결 리스트

리스트 추상화1 - 인터페이스 도입

List 자료구조

리스트 추상화2 - 의존관계 주입

데이터를 앞에서 추가하거나 삭제할 때 빅오 비교

구체적인 MyArrayList 에 의존하는 BatchProcessor 예시

추상적인 MyList에 의존하는 BatchProcessor 예시

리스트 추상화3 - 컴파일 타임, 런타임 의존관계

컴파일 타임 의존관계 vs 런타임 의존관계

컴파일 타임 의존관계

런타임 의존관계

정리

직접 구현한 리스트의 성능 비교

직접 구현한 리스트의 성능 비교

직접 만든 배열 리스트와 연결 리스트 - 성능 비교 표

추가, 삭제

앞에 추가(삭제)

평균 추가(삭제)

뒤에 추가(삭제)

인덱스 조회

검색

시간 복잡도와 실제 성능

배열 리스트 vs 연결 리스트

자바 리스트

List 자료 구조

컬렉션 프레임워크 - 리스트

Collection 인터페이스

List 인터페이스 `List` 인터페이스는 `java.util` 패키지에 있는 컬렉션 프레임워크의 일부다.

`List` 는 객체들의 순서가 있는 컬렉션을 나타내며, 같은 객체의 중복 저장을 허용한다. 이 리스트는 배열과 비슷하지만, 크기가 동적으로 변화하는 컬렉션을 다룰 때 유연하게 사용할 수 있다.

자바 ArrayList

자바 ArrayList의 특징

데이터 추가 - 메모리 고속 복사 연산 사용

자바 LinkedList

자바의 LinkedList 특징

이중 연결 리스트

자바 리스트의 성능 비교

직접 만든 배열 리스트와 연결 리스트 - 성능 비교 표

자바가 제공하는 배열 리스트와 연결 리스트 - 성능 비교 표

데이터를 추가할 때 자바 ArrayList가 직접 구현한 MyArrayList보다 빠른 이유

시간 복잡도와 실제 성능

배열 리스트 vs 연결 리스트