gugbab2's GitBook
  • Language
    • C++
      • 강의
        • C++ 언매니지드 프로그래밍
          • C++ 프로그래밍
          • 출력(Output)
          • 입력(Input)
          • bool 타입, Reference
          • 상수(const)
          • 문자열(string)
          • 파일 입출력
          • 개체지향 프로그래밍1
          • 개체지향 프로그래밍2
          • 개체지향 프로그래밍3
          • 캐스팅(형변환, casting)
          • 인라인 함수
          • static 키워드
          • 예외(Exception)
          • STL(Standard Template Library) 컨테이너(Container) - Vector
          • STL 컨테이너 - Map
          • STL 컨테이너 - Queue, Stack, Set, List
          • 템플릿(Template) 프로그래밍
          • 새로운 키워드(C++11 ~) 1
          • 새로운 키워드(C++11 ~) 2
          • 새로운 자료형
          • 새로운 STL 컨테이너
          • 스마트(smart) 포인터
          • 이동생성자 및 이동대입연산자
          • constexpr
          • Lamda Expression
      • 책
        • The C++ Programming Lanuaage
          • 2부 : 기본 기능
            • 6. 타입과 선언
            • 7. 포인터, 배열, 참조
            • 8. 구조체(struct), 공용체(union), 열거형(enum)
            • 10. 표현식
            • 11. 선택 연산
            • 12. 함수
            • 13. 예외 처리
            • 15. 소스 파일과 프로그램
          • 3부 : 추상화 메커니즘
            • 16. 클래스
            • 17. 생성, 소멸, 복사와 이동
            • 18. 연산자 오버로딩
            • 19. 특수 연산자
            • 20. 파생클래스
        • 씹어먹는 C++
          • 2. C++ 참조자(reference) 의 도입
          • 5.1 연산자 오버로딩(비교, 대입 연산자)
          • 5-2. 연산자 오버로딩(이항, 입출력, 타입변환, 증감 연산자)
          • 6-2. 가상(virtual) 함수와 다형성
          • 6-3. 가상 함수에 대한 지식들
          • 9-1. 코드를 찍어내는 틀 - C++ 템플릿(template)
          • 9-2. 가변 길이 템플릿(Variadic template)
          • 9-3. 템플릿 메타 프로그래밍 (Template Meta Programming)
          • 9-4. 템플릿 메타 프로그래밍2
          • 16.1 유니폼 초기화(Uniform Initialization)
          • 토막글 2. 람다(lambda)
    • Java
      • 강의
        • 김영한의 실전 자바 - 기본편
          • 절차 지향 vs 객체 지향
            • 절차 지향 프로그래밍
            • 객체 지향 프로그래밍
          • 변수
            • 클래스 변수 / 인스턴스 변수, 멤버 변수 / 지역 변수
            • 기본형 vs 참조형
          • 패키지
            • 패키지
            • CLI 환경에서 .java 파일 컴파일 && 실행
          • 접근 제어자
            • 접근 제어자 - 기본
            • 캡슐화
          • static
            • 자바 메모리 구조
            • static 기본
            • 스택 영역, 힙 영역
              • 스택 영역, 힙 영역 - 기본
              • 메소드가 실행될 때 어떤일이 일어나는가?
          • 상속
            • 상속 기본
          • 다형성(Pilymorphism)
            • 다형성 기본
            • 다형성의 활용
              • 다형성의 활용 - 기본
              • 다형성의 활용 - 추상클래스
              • 다형성의 활용 - 인터페이스
            • 다형성과 설계
              • 좋은 객체 지향 프로그래밍
        • 김영한의 실전 자바 - 중급1편
          • 1. Object 클래스
          • 2. 불변 객체
          • 3. String 클래스
          • 4. 래퍼, Class 클래스
          • 5. 열거형 - ENUM
          • 6. 날짜와 시간
          • 7. 중첩 클래스, 내부 클래스1
          • 8. 중첩 클래스, 내부 클래스2
          • 9. 예외 처리1 - 이론
          • 10. 예외 처리 - 실습
        • 김영한의 실전 자바 - 중급2편
          • 1. 제네릭 - Generic1
          • 2. 제네릭 - Generic2
          • 3. 컬렉션 프레임워크 - ArrayList
          • 4. 컬렉션 프레임워크 - LinkedList
          • 5. 컬렉션 프레임워크 - List
          • 6. 컬렉션 프레임워크 - 해시(Hash)
          • 7. 컬렉션 프레임워크 - HashSet
          • 8. 컬렉션 프레임워크 - Set
            • 레드 블랙 트리
          • 9. 컬렉션 프레임워크 - Map, Stack, Queue
            • 왜(?) Set 은 내부에서 Map 을 사용할까?
          • 10. 컬렉션 프레임워크 - 순회, 정렬, 전체 정리
        • 김영한의 실전 자바 - 고급 1편, 멀티스레드와 동시성
          • 프로세스와 스레드 소개
          • 스레드 생성과 실행
          • 스레드 제어와 생명 주기1
          • 스레드 제어와 생명 주기2
          • 메모리 가시성
          • 동기화 - synchronized
            • synchronized 키워드 이해도 체크
          • 고급 동기화 - concurrent.Lock
          • 생산자 소비자 문제1
          • 생산자 소비자 문제2
          • CAS - 동기화와 원자적 연산
          • 동시성 컬렉션
          • 스레드 풀과 Executor 프레임워크1
          • 스레드 풀과 Executor 프레임워크2
        • 김영한의 실전 자바 - 고급 2편, I/O, 네트워크, 리플렉션
          • 문자 인코딩
          • I/O 기본1
          • I/O 기본2
          • I/O 활용
          • File, Files
          • 네트워크 - 프로그램1
          • 네트워크 - 프로그램2
          • 채팅 프로그램
          • HTTP 서버 만들기
          • 리플렉션
          • 애노테이션
          • HTTP 서버 활용
        • 김영한의 실전 자바 - 고급3편, 람다, 스트림, 함형 프로그래밍
          • 람다가 필요한 이유
          • 람다
          • 함수형 인터페이스
          • 람다 활용
          • 람다 vs 익명 클래스
          • 메서드 참조
          • 스트림API1 - 기본
          • 스트림 API2 - 기능
          • 스트림 API3 - 컬렉터
          • Optional
          • 디폴트 메서드
          • 병렬 스트림
          • 함수형 프로그래밍
        • 기초 탄탄! 독하게 시작하는 Java - Part2: OOP 와 JVM
          • 2. 클래스 - 첫 번째
          • 3. 클래스 - 두번째
          • 4. 상속과 관계
          • 6. JVM(Java Virtual machine) 기본 이론
          • 7. JVM 과 GC 그리고 객체
          • 8. 불변 객체와 String 클래스
      • 책
        • 자바의 신
          • 변수
            • 클래스 변수(static) 사용 주의 케이스
            • Java volatile 과 Atomic 변수(+CAS)
          • 연산자
            • 비트 연산자 활용 예제
          • 배열
          • 참조 자료형
          • 상속
          • Object 클래스
          • interface, abstract class, enum
          • 예외
          • String 클래스
            • String 구조
            • String 문자열을 byte 로 변환하기
            • String 클래스에서 자주 사용되는 메서드
            • String 클래스로 살펴보는 불변(Immutable)객체
            • StringBuilder, StringBuffer
          • Nested 클래스
          • 어노테이션
            • 어노테이션 기본
            • 어노테이션의 사용
          • JVM 이해하기
            • 왜 JVM 을 사용해?
            • JVM, JRE, JDK
            • JVM 구조 이해하기
            • 클래스 로더 시스템
            • JIT(Just-In-Time) 컴파일러
            • GC(Garbage Collector)
              • GC Part.1
              • GC Part.2
              • GC 튜닝
          • java.lang
            • Wrapper 클래스
            • System 클래스
          • Generic
            • 제네릭 기본
            • 와일드카드
            • 와일드카드 GET / SET 경계
            • 와일드카드 extends / super 사용시기
            • 혼동할 수 있는 와일드카드 표현
          • Collection
            • 자료구조
              • 이진 탐색 트리 vs 레드 블랙 트리
            • Collection
            • List
              • ArrayList
              • Vector
              • Stack
              • LinkedList
            • Set, Queue
              • HashSet
              • LinkedHashSet
              • TreeSet
              • Priority Queue
              • ArrayDeque
            • Map
              • HashMap
              • Hashtable
              • LinkedHashMap
              • TreeMap
          • Thread
            • Thread 기본
            • Thread 와 관련이 많은, Synchronized
            • Thread 를 통제하는 메서드
            • ThreadGroup
          • I/O
            • InputStream, OutputStream
            • Reader, Writer
          • Serializable, NIO
            • Serializable
            • NIO (New IO)
          • 네트워크 프로그래밍
            • 네트워크 기본 & TCP 통신
            • UDP 통신
          • 람다
            • 함수형 인터페이스
            • 람다란?
        • 벨둥(Bealdung)
          • Java Concurrency
            • Java Concurrency Basics
              • Overview of the java.util.concurrent
              • Guide to the Synchronized Keyword in Java
              • Guide to the Volatile Keyword in Java
              • Guide to the java.util.concurrent.Future
              • ThreadLocal in Java
      • 그 외
        • 시스템 콜과 자바에서의 시스템 콜 사용례
        • 자바 NIO 의 동작원리 및 IO 모델
        • 함수형 인터페이스(FunctionInterface) - 자바8
  • Spring
    • 강의
      • 스프링 핵심 원리 - 기본편
        • 큰 흐름 잡기
        • 스프링 핵심 원리 이해1 - 예제 만들기
        • 스프링 핵심 원리 이해2 - 객체 지향 원리 적용
        • 스프링 컨테이너와 스프링 빈
        • 싱글톤 컨테이너
        • 컴포넌트 스캔
        • 의존관계 자동 주입
        • 빈 생명주기 콜백
        • 빈 스코프
      • 토비의 스프링6 - 이해와 원리
        • 3. 오브젝트와 의존관계1
        • 3. 오브젝트와 의존관계2
        • 4. 테스트
        • 5. 템플릿
        • 6.예외
        • 7. 서비스 추상화
    • 책
      • JSP 2.3 웹 프로그래밍
        • Servlet
        • JSP
        • 쿠키 / 세션
        • MVC 패턴
        • 실무 때 고민할 만한 부분
      • 스프링 입문을 위한 자바 객체지향의 원리와 이해
        • 자바와 절차적/구조적 프로그래밍
        • 객체지향의 4대 특성
        • 객체지향 설계의 5원칙
        • 스프링이 사랑한 디자인 패턴
        • IoC / DI
        • AOP(Aspect Oriented Programming), 관점 지향 프로그래밍
      • 토비의 스프링 3.1
        • Spring vs Spring Boot
        • 1. 오브젝트와 의존관계
          • 1.4 제어의 역전(IoC)
          • 1.5 스프링의 IoC
          • 1.6 싱글톤 레지스트리와 오브젝트 스코프
    • 그 외
      • 스프링 부트(SpringBoot) 탄생 배경
  • CS
    • DATA STRUCTURES
      • 선택 정렬(Selection Sort)
      • 버블 정렬(Bubble Sort)
      • 삽입 정렬(Insertion Sort)
    • OS
      • 강의
      • 책
        • 혼자 공부하는 컴퓨터구조 + 운영체제
          • 1. 컴퓨터 구조 시작하기
          • 2. 데이터
          • 3. 명령어
          • 4. CPU 의 작동원리
          • 5. CPU 성능 향상 기법
          • 6. 메모리와 캐시메모리
          • 7. 보조기억장치
          • 8. 입출력장치
          • 9. 운영체제 시작하기
          • 10. 프로세스와 스레드
    • NETWORK
      • 그 외
        • REST API
          • REST API
          • URI & MIME type
          • Collection Pattern
          • Collection Pattern 적용
          • Spring Web MVC 구현
        • SSL 인증 동작
        • DTO & JSON & CROS
          • DTO
          • 직렬화(Serialization)
          • Jackson ObjectMapper
          • CROS
        • Connection Timeout / Read Timeout
      • 강의
        • 외워서 끝내는 네트워크 핵심이론 - 기초
          • Internet 기반 네트워크 입문
            • Host 는 이렇게 외우자
            • 스위치가 하는 일과 비용
          • L2 수준에서 외울 것들
            • NIC, L2 Frame, LAN 카드 그리고 MAC 주소
            • L2 스위치에 대해서
            • LAN 과 WAN 의 경계 그리고 Broadcast
          • L3 수준에서 외울 것들
            • IPv4 주소의 기본 구조
            • L3 IP Packet 으로 외워라
            • 패킷의 생성과 전달 및 계층별 데이터 단위
            • 이해하면 인생이 바뀌는 TCP/IP 송, 수신 구조
            • IP 헤더 형식
            • 서브넷 마스크와 CIDR
            • Broadcast IP 주소와 Localhost
            • TTL 과 단편화
            • 인터넷 설정 자동화를 위한 DHCP
            • ARP 과 Ping(RTT : Round Trip Time)
          • L4 수준 대표주자 TCP 와 UDP
            • TCP 와 UDP 개요
            • TCP 연결 및 상태 변화
            • TCP 연결 종료 및 상태 변화
            • TCP, UDP 헤더 형식과 게임서버 특징
            • TCP 가 연결이라는 착각
            • TCP 연결과 게임버그
          • 웹을 이루는 핵심기술
            • DNS
            • URL, URI
        • 외워서 끝내는 네트워크 핵심 이론 - 응용
          • 네트워크 장치의 구조
            • 세 가지 네트워크 장치 구조
            • Inline 구조
            • Out of path 구조와 DPI 그리고 망중립
            • Proxy(클라이언트 입장) - 우회
            • Proxy(클라이언트 입장) - 보호와 감시
            • Reverse Proxy(서버 입장)
          • 인터넷 공유기의 작동 원리
            • 공유기 개요
            • Symmetric NAT
            • Full Cone 방식
            • Restricted Cone, Port Restricted Cone
            • 포트 포워딩
            • UPnP 와 NAT
          • 부하분산 시스템 작동 원리
            • L4 부하분산 무정지 시스템
            • 대규모 부하분산을 위한 GSLB
          • VPN과 네트워크 보안 솔루션
            • PN 과 VPN
            • IPSec VPN 과 터널링 개념
            • VPN 과 재택근무
        • 외워서 끝내는 SSL 과 최소한의 암호기술
          • 기초이론
            • Checksum (검사합)
            • Hash
          • 암호기술에 대한 이해
            • 대칭키
            • 비대칭키
          • PKI 시스템과 인터넷
            • 인터넷을 위한 비대칭키 체계
            • 공개키 신뢰를 위한 검증체계
            • 웹서비스와 공인인증서
      • 책
        • 그림으로 배우는 네트워크 원리
          • 1. 네트워크 기본
          • 2. 네트워크를 만드는 것
          • 3. 네트워크의 공통 언어 TCP/IP
    • SECURITY
      • 그 외
        • Basic Auth
        • HMAC 기반 인증
    • 그 외
      • 동기/비동기 & 블로킹/논블록킹
  • DB
    • 그 외
      • 인덱스(Index)
      • 트랜잭션(TRANSACTION)
      • 실무에서 외래키를 사용하지 않는 이유
      • ORM vs SQL Mapper
      • 문자열 vs DATE
      • EXPLAIN 명령어
    • 강의
      • Real MySQL 시즌 1
        • Part.1
          • 1강. CHAR vs VARCHAR
          • 2강. VARCHAR vs TEXT
          • 3강. COUNT(*) & COUNT(DISTINCT) 튜닝
          • 4강. 페이징 쿼리 작성
          • 5강. Stored Function
      • 토크온 41차. JPA 프로그래밍 기본 다지기
        • 1. JPA 소개
        • 2. JPA 기초와 매핑
        • 3. 필드와 컬럼 매핑
        • 4. 연관관계 매핑
        • 5. 양방향 매핑
        • 6. JPA 내부구조
        • 7. JPA 객체지향쿼리
        • 8. Spring Data JPA 와 QueryDSL 이해
    • 책
  • Software Development Methodology
    • TDD
      • 강의
        • Spring Boot TDD - 입문부터 실전까지 정확하게
          • 세션2. TDD 소개
          • 세션5. API 설계
          • 세션6. TDD 주기 첫 번째 경험
          • 세션7. TDD 주기 반복
      • 그 외
        • 단위 테스트(Unit Test) 작성의 필요성
        • JUnit5
          • A Guide to JUnit 5
          • Guide to JUnit 5 Parameterized Tests
          • AssertJ Exception Assertions
          • Testing in Spring Boot
          • Junit 과 Mockito 기반의 Spring 단위 테스트 코드 작성법
        • Code Coverage
          • Code Coverage?
    • DDD
      • 책
        • 도메인 주도 설계(Domain-Driven Design)
          • 04 - 도메인의 격리
          • 05 - 소프트웨어에서 표현되는 모델
          • 06 - 도메인 객체의 생명주기
          • 07 - 언어의 사용(확장 예제) (1)
          • 07 - 언어의 사용(확장 예제) (2)
        • 도메인 주도 개발 시작하기
          • 1. 도메인 모델 시작하기
          • 2. 아키텍처 개요
          • 3. 애그리거트
          • 4. 리포지터리와 모델 구현
            • DAO vs Repository
      • 강의
        • DDD 세레나데(NEXTSTEP)
          • 1주차
            • 도메인 주도 설계 등장 배경
            • 레거시 코드
            • 유연한 설계 - ASSERTION
          • 2주차
            • 전략적 설계 - UBIQUITOUS LANGUAGE
            • 전략적 설계 - BOUNDED CONTEXT
          • 3주차
            • 전술적 설계 - VALUE OBJECT 와 ENTITY
            • 전술적 설계 - AGGREGATE 와 REPOSITORY
            • 전술적 설계 - SERVICE
    • REFACTORING
      • 일급 컬렉션(First Class Collection) 소개와 사용해야하는 이유
  • ARCHITECTURE
    • Event Driven Architecture
  • 멘토링
    • F-Lab
      • 10회차(2024.12.29)
Powered by GitBook
On this page
  • 1. 세대별 컬렉션 이론
  • 세대 단위 컬렉션 이론 (몇가지 가설을 참고한다)
  • JVM heap 영역 (상세)
  • 2. 대표적 GC 알고리즘(Mark, Sweep, Compact)
  • 🟩 1. Mark and Sweep
  • 🟩 2. Mark and Copy
  • 🟩 3. Mark and Compact
  • 3. 도달 가능성 분석
  • 도달 가능성 분석
  • GC 루트 객체가 될 수 있는 것들
  • 4. G1(Garbage First) GC
  • 클래식 GC 종류
  • 📘 1. Serial GC
  • 📘 2. ParNew GC
  • 📘 3. Parallel GC (Parallel Scavenge)
  • 📘 4. CMS (Concurrent Mark Sweep) GC
  • 📘 5. G1 GC (Garbage First GC)
  • 5. 객체(Java Object) 메모리 레이아웃과 해시코드
  • Object header
  • Instance data
  1. Language
  2. Java
  3. 강의
  4. 기초 탄탄! 독하게 시작하는 Java - Part2: OOP 와 JVM

7. JVM 과 GC 그리고 객체

Previous6. JVM(Java Virtual machine) 기본 이론Next8. 불변 객체와 String 클래스

Last updated 20 days ago

1. 세대별 컬렉션 이론

세대 단위 컬렉션 이론 (몇가지 가설을 참고한다)

  • 대다수 객체는 일찍 사라짐, 참조가 사용되지 않음. (약한 세대 가설)

    • Eden 영역에서 대부분 사라질 것이다!

  • GC 과정에서 살아남은 회수가 늘어날 수록 (앞으로도) 생존 가능성이 높아짐. (강한 세대 가설)

  • 다른 세대에 속한 객체간 참조는 같은 세대에 속한 객체간 참조보다 훨씬 적음 (세대 간 참조 가설)

  • Hotspot VM 에서 에덴과 생존자 공간비율은 보통 8:1

    • IBM 연구에 따름 (보통 첫 GC 에 대략 98% 객체가 소멸)

    • 파편화 방지를 위해 활용 Survivor space 사용

JVM heap 영역 (상세)

🟦 Young Generation (신생 세대)

  • Eden + Survivor(S0, S1) 공간으로 구성됨

  • 새로 생성된 객체 대부분은 Eden 영역에 먼저 할당

  • Minor GC가 발생하면 Eden + 하나의 Survivor를 청소하고, 살아남은 객체는 다른 Survivor 또는 Old Generation으로 "승격(Promotion)" 됨

▸ Eden

  • 객체가 최초로 할당되는 공간

  • GC가 자주 일어나고, 객체 생명주기가 짧음

▸ Survivor space (S0, S1)

  • GC 시 복사-이동 대상이 되는 공간

  • S0와 S1은 번갈아가며 사용됨 (from-space, to-space)

  • 여러 번 살아남은 객체는 Old Generation으로 승격

  • age bit 사용 (참조계수) -> 클래스 메타데이터에 포함


🟦 Old Generation (Tenured)

  • 장기 생존 객체가 저장되는 공간

  • Minor GC에선 건드리지 않으며, Major GC나 Full GC 시에 청소됨

  • Full GC는 이 영역이 꽉 찼거나, Promotion 대상이 들어갈 공간이 없을 때 발생

2. 대표적 GC 알고리즘(Mark, Sweep, Compact)

🟩 1. Mark and Sweep

📆 1960년대 초 John McCarthy 제안 (LISP GC의 기초)

🔧 작동 방식

  1. Mark 단계

    • GC Root(스택, static 변수 등)에서 도달 가능한 객체를 표시(mark)

    • 이때 방문한 객체에 "mark bit"를 세팅함

  2. Sweep 단계

    • 힙 전체를 선형 탐색하며, mark되지 않은(dead) 객체를 회수(free)

    • 단, 메모리 정리는 안 함 → 단편화 발생

⚠️ 단점

  • 파편화 발생: 객체가 삭제돼도 자리는 남아있어 조각난 공간이 생김

  • 연속 공간 확보 어려움 → 큰 객체 할당 실패

  • STW 시간 길어짐: 전체 Heap을 선형으로 탐색하기 때문

🧠 JVM 적용

  • 현대 JVM에서는 단독으로 사용되지 않음

  • 하지만 기본 개념이 CMS, G1, ZGC 등 거의 모든 GC에 내재


🟩 2. Mark and Copy

📆 1974년 Robert Fenichel & Peter Bishop 제안 → Copying Collector라고도 불림

🔧 작동 방식

  • Heap을 두 영역으로 나눔 (From / To Space)

  • 객체는 항상 From 영역에 생성

  • GC 시:

    • 살아있는 객체만 To 영역에 복사

    • 참조 포인터를 모두 새 객체로 갱신

  • GC 후, From ↔ To 역할을 스왑

Eden → Survivor0 (Copy) → Survivor1 (Copy) ...

⚠️ 단점

  • 메모리 낭비: 절반은 항상 비어 있어야 → 유효 메모리는 전체 Heap의 50% 미만

  • 복사 비용 존재: 살아있는 객체를 이동해야 함

📌 JVM 적용

  • Young 영역 (Eden + Survivor)에서 사용

  • Survivor 영역이 2개 (S0, S1): 교대로 사용되며, Eden:S0:S1 비율은 기본 8:1:1

  • 객체 생존율이 낮은 Young 영역에 최적화된 방식


🟩 3. Mark and Compact

📆 1970년대 중반 Edward L. Ruders 등 제안 → Mark-Sweep의 파편화 문제 + Copy의 메모리 낭비를 함께 해결

🔧 작동 방식

  1. Mark 단계

    • 도달 가능한 객체에 mark bit 설정

  2. Compact 단계

    • 힙 앞쪽으로 객체들을 밀어넣으며 정렬 압축

    • 이후 공간은 free로 남김 → 연속 공간 확보

⚠️ 단점

  • 객체가 많을수록 이동 비용 커짐

  • 포인터 갱신 비용: 객체 주소가 바뀌므로 참조하는 곳도 모두 변경

  • STW가 발생함 (전체 압축 동안 애플리케이션 멈춤)

📌 JVM 적용

  • 주로 Old 영역에서 사용

  • 대표적으로 Parallel Old GC, G1 GC의 Old Region, Serial Old GC에서 사용됨

3. 도달 가능성 분석

도달 가능성 분석

  • 도달 가능성 분석(Reachability analysis) 알고리즘에 기초해 회수 대상 인스턴스를 판단

  • GC 루트 객체들을 기점으로 참조하는 다른 객체들을 탐색하는 방식

  • 힙 메모리가 크다보면 Full GC 가 났을 때 도달 가능성 분석 시간이 너무 오래 걸릴 수 있기 때문에, 힙 메모리를 늘리는 것이 좋은가? 는 한번 더 생각해 볼 필요가 있다.

GC 루트 객체가 될 수 있는 것들

  • JVM stack frame 지역변수 테이블에서 참조하는 객체 (현재 실행 중인 메서드)

  • Synchronized 키워드로 잠겨 있는(모니터 락) 객체

  • JNI 가 참조하는 객체

  • 메서드 영역에서 클래스 정적 필드로 참조하는 객체

  • 메서드 영역에서 상수로 참조되는 객체

  • JVM 내부에서 사용되는 참조

4. G1(Garbage First) GC

Stop-The-World(STW) ?

  • Stop-The-World(STW)는 GC가 실행될 때 모든 애플리케이션 스레드를 멈추는 순간입니다.

  • 왜 멈추냐면? 👉 GC는 메모리 객체를 스캔하면서 참조 그래프를 따라 이동하는데, 그 사이 애플리케이션이 객체를 수정하면 무결성이 깨지기 때문입니다.

[A] --> [B] --> [C]

GC가 B를 따라가고 있는데, 앱이 B를 C에서 D로 바꾸면? → GC가 엉뚱한 걸 참조함

클래식 GC 종류

GC 종류
동작 방식
멀티스레드
주요 목적
현재 상태

Serial

STW + 단일 스레드

❌

단순성, 저자원

유지

ParNew

STW + Young 병렬

✅

CMS 보조용

CMS 제거와 함께 사라지는 중

Parallel (Scavenge)

STW + Young/Old 병렬

✅

Throughput 극대화

유지

CMS

Old 영역 병행 수집

✅ (일부 STW)

정지시간 최소화

제거됨 (Java 14)

G1

Region 기반 수집

✅

Predictable pause time

✅ 기본 GC

📘 1. Serial GC

  • Java에서 가장 기본적인 GC 방식입니다.

  • Young과 Old 영역 모두 단일 스레드로 GC 작업을 수행합니다.

  • GC가 실행되면 전체 애플리케이션이 Stop-The-World(STW) 상태에 진입합니다.

  • Young 영역은 Mark and Copy, Old 영역은 Mark and Compact 알고리즘을 사용합니다.

  • 구현이 매우 단순하고 리소스 사용량이 적기 때문에, 임베디드 환경이나 테스트용 소형 애플리케이션에 적합합니다.

  • 병렬/병행 처리가 불가능하므로, Heap 크기가 커질수록 GC 정지 시간이 급격히 증가합니다.

🧱 특징:

  • 구조가 단순하여 이해와 디버깅이 쉬움

  • 작은 Heap에서 효율적

  • STW 시간이 비교적 길어질 수 있음

  • 병렬 GC 기능이 없어 서버 환경에는 적합하지 않음


📘 2. ParNew GC

  • Serial GC의 Young 영역 수집을 멀티스레드화한 GC입니다.

  • Young 영역만 병렬 수집하며, Old 영역은 CMS 또는 Serial Old와 함께 처리됩니다.

  • 단독 사용보다는 CMS GC의 Young 영역 수집기로 주로 사용됩니다.

  • GC 중 일부 STW가 발생하지만, Serial GC보다는 정지 시간이 짧아집니다.

  • CMS와 조합 시 병렬 Young 수집 + 병행 Old 수집 구조로 활용됩니다.

🧱 특징:

  • Young 영역에서 병렬 수집을 지원

  • Old 영역은 여전히 CMS나 Serial Old에 의존

  • CMS 기반 시스템에서 Young GC 성능을 향상시킴

  • 완전한 병렬 GC는 아님 (Old 영역은 병렬화되지 않음)


📘 3. Parallel GC (Parallel Scavenge)

  • 전체 처리량(Throughput)을 극대화하기 위해 설계된 GC입니다.

  • Young 영역과 Old 영역 모두를 멀티스레드로 병렬 수집합니다.

  • Young 영역은 Parallel Scavenge, Old 영역은 Parallel Old 알고리즘을 사용합니다.

  • GC 중에는 STW가 발생하지만, 작업을 병렬로 수행하므로 총 시간은 짧아질 수 있습니다.

  • Throughput이 중요한 배치 처리, 대용량 연산 중심의 서버 환경에서 적합합니다.

🧱 특징:

  • Young + Old 영역 모두 병렬 처리 가능

  • Throughput 중심 애플리케이션에 최적화

  • GC 시간 자체는 길 수 있으나, 애플리케이션 전체 처리 효율은 높음

  • 지연시간이 중요한 서비스에는 적합하지 않을 수 있음


📘 4. CMS (Concurrent Mark Sweep) GC

  • GC로 인한 정지 시간(STW)을 최소화하기 위해 도입된 GC입니다.

  • Old 영역의 수집을 병행(Concurrent)으로 수행하며, 일부 단계에서만 STW가 발생합니다.

  • 수집 단계는 Initial Mark(STW) → Concurrent Mark → Remark(STW) → Concurrent Sweep 순으로 진행됩니다.

  • Old 영역에서는 Compaction을 수행하지 않기 때문에 메모리 단편화가 발생할 수 있습니다.

  • 이로 인해 할당 실패(Allocation Failure)나 OOM 가능성이 존재합니다.

  • Java 9에서 deprecated, Java 14에서 완전히 제거되었습니다.

🧱 특징:

  • STW 시간을 줄이기 위한 병행 수집 방식

  • 메모리 단편화 발생 가능성

  • 실시간 응답이 중요한 시스템에 한때 많이 사용되었음

  • G1 GC의 등장으로 대체됨


📘 5. G1 GC (Garbage First GC)

  • CMS의 단점을 보완하기 위해 Java 7에 도입되었으며, Java 9부터 기본 GC로 채택되었습니다.

    • CMS 는 compaction 을 수행하지 않아서, 메모리 단편화로 인해 OOM 이 발생할 수 있다.

    • CMS는 대부분 병행으로 실행되지만, Initial Mark, Remark 단계는 여전히 STW, 이로인해 GC 발생시기나, STW 길이가 예측 불가하다.

  • 전체 Heap을 고정 크기의 Region 단위로 나누어 관리합니다.

  • 각 Region은 GC 시점마다 Eden, Survivor, Old 등의 역할이 동적으로 할당됩니다.

  • Young/Old 영역 구분 없이 가비지가 많은 Region을 우선적으로 수집합니다.

  • GC 정지 시간을 예측하기 위해 -XX:MaxGCPauseMillis 옵션으로 목표 시간을 설정할 수 있으며, 내부적으로 작업을 분산(GC Scheduling)하여 정지 시간을 예측 가능하게 조절합니다.

  • 대용량 Heap에서도 파편화 없이 연속 공간을 확보할 수 있습니다.

🧱 특징:

  • 4GB 이상 대용량 Heap에 적합

  • Region 기반 관리로 단편화 방지

  • Predictable pause time 설정 가능

  • CMS의 단점을 대부분 보완한 현대적 GC 방식

5. 객체(Java Object) 메모리 레이아웃과 해시코드

Object header

  • Mark word

    • Hash code

      • Hash code 는 Object.hashCode() 함수가 호출되는 시점에 계산

        • Hash code 는 연산에 비용이 들어가기 때문에, 실제 함수가 호출될 때만 계산한다.

      • Hash code 는 어떤 인스턴스에 대해서 Unique 하게 식별할 수 있는 값을 의미한다.

      • Native 언어는 주소가 있기 때문에, 해당 값이 필요하지 않을 수 있다..

      • 하지만 Java 는 JVM 이 주소를 관리하기 때문에, 개발자 입장에서 Unique 하게 식별할 수 있는 방법이 필요하다.

    • Object age

      • GC 에서 살아남은 횟수 (비트단위 데이터)

    • Lock flag

      • Lock flag 를 중심으로 멀티스레드 환경에서 경쟁조건이 발생하는 문제를 해결하기 위한 것

      • 모니터 락

  • Klass work

    • Class 예약어가 있기에 Klass 로 표현

    • Class meta data(Metaspace 영역) 의 레퍼런스

  • length(Array)

    • 배열임을 나타내는 정보

Hash(함수) 의 특징

f(x) -> y 만 가능한 단방향 함수

  • 단방향성 (이 특정을 사용해서 DB 에 메모리를 저장할 때 해시값을 저장)

  • 입력 값의 크기와 상관 없이 결과 값의 길이(혹은 크기) 가 일정 (Unique)

  • 데이터 무결성 확보와 관련해 IT 기술 전반(특히 보안)에서 사용된다.

  • 대표적 해시 알고리즘

    • MD-5, SHA-1

    • SHA-128, 256, 384, 512

Instance data