gugbab2's GitBook
  • Language
    • C++
      • 강의
        • C++ 언매니지드 프로그래밍
          • C++ 프로그래밍
          • 출력(Output)
          • 입력(Input)
          • bool 타입, Reference
          • 상수(const)
          • 문자열(string)
          • 파일 입출력
          • 개체지향 프로그래밍1
          • 개체지향 프로그래밍2
          • 개체지향 프로그래밍3
          • 캐스팅(형변환, casting)
          • 인라인 함수
          • static 키워드
          • 예외(Exception)
          • STL(Standard Template Library) 컨테이너(Container) - Vector
          • STL 컨테이너 - Map
          • STL 컨테이너 - Queue, Stack, Set, List
          • 템플릿(Template) 프로그래밍
          • 새로운 키워드(C++11 ~) 1
          • 새로운 키워드(C++11 ~) 2
          • 새로운 자료형
          • 새로운 STL 컨테이너
          • 스마트(smart) 포인터
          • 이동생성자 및 이동대입연산자
          • constexpr
          • Lamda Expression
      • 책
        • The C++ Programming Lanuaage
          • 2부 : 기본 기능
            • 6. 타입과 선언
            • 7. 포인터, 배열, 참조
            • 8. 구조체(struct), 공용체(union), 열거형(enum)
            • 10. 표현식
            • 11. 선택 연산
            • 12. 함수
            • 13. 예외 처리
            • 15. 소스 파일과 프로그램
          • 3부 : 추상화 메커니즘
            • 16. 클래스
            • 17. 생성, 소멸, 복사와 이동
            • 18. 연산자 오버로딩
            • 19. 특수 연산자
            • 20. 파생클래스
        • 씹어먹는 C++
          • 2. C++ 참조자(reference) 의 도입
          • 5.1 연산자 오버로딩(비교, 대입 연산자)
          • 5-2. 연산자 오버로딩(이항, 입출력, 타입변환, 증감 연산자)
          • 6-2. 가상(virtual) 함수와 다형성
          • 6-3. 가상 함수에 대한 지식들
          • 9-1. 코드를 찍어내는 틀 - C++ 템플릿(template)
          • 9-2. 가변 길이 템플릿(Variadic template)
          • 9-3. 템플릿 메타 프로그래밍 (Template Meta Programming)
          • 9-4. 템플릿 메타 프로그래밍2
          • 16.1 유니폼 초기화(Uniform Initialization)
          • 토막글 2. 람다(lambda)
    • Java
      • 강의
        • 김영한의 실전 자바 - 기본편
          • 절차 지향 vs 객체 지향
            • 절차 지향 프로그래밍
            • 객체 지향 프로그래밍
          • 변수
            • 클래스 변수 / 인스턴스 변수, 멤버 변수 / 지역 변수
            • 기본형 vs 참조형
          • 패키지
            • 패키지
            • CLI 환경에서 .java 파일 컴파일 && 실행
          • 접근 제어자
            • 접근 제어자 - 기본
            • 캡슐화
          • static
            • 자바 메모리 구조
            • static 기본
            • 스택 영역, 힙 영역
              • 스택 영역, 힙 영역 - 기본
              • 메소드가 실행될 때 어떤일이 일어나는가?
          • 상속
            • 상속 기본
          • 다형성(Pilymorphism)
            • 다형성 기본
            • 다형성의 활용
              • 다형성의 활용 - 기본
              • 다형성의 활용 - 추상클래스
              • 다형성의 활용 - 인터페이스
            • 다형성과 설계
              • 좋은 객체 지향 프로그래밍
        • 김영한의 실전 자바 - 중급1편
          • 1. Object 클래스
          • 2. 불변 객체
          • 3. String 클래스
          • 4. 래퍼, Class 클래스
          • 5. 열거형 - ENUM
          • 6. 날짜와 시간
          • 7. 중첩 클래스, 내부 클래스1
          • 8. 중첩 클래스, 내부 클래스2
          • 9. 예외 처리1 - 이론
          • 10. 예외 처리 - 실습
        • 김영한의 실전 자바 - 중급2편
          • 1. 제네릭 - Generic1
          • 2. 제네릭 - Generic2
          • 3. 컬렉션 프레임워크 - ArrayList
          • 4. 컬렉션 프레임워크 - LinkedList
          • 5. 컬렉션 프레임워크 - List
          • 6. 컬렉션 프레임워크 - 해시(Hash)
          • 7. 컬렉션 프레임워크 - HashSet
          • 8. 컬렉션 프레임워크 - Set
            • 레드 블랙 트리
          • 9. 컬렉션 프레임워크 - Map, Stack, Queue
            • 왜(?) Set 은 내부에서 Map 을 사용할까?
          • 10. 컬렉션 프레임워크 - 순회, 정렬, 전체 정리
        • 김영한의 실전 자바 - 고급 1편, 멀티스레드와 동시성
          • 프로세스와 스레드 소개
          • 스레드 생성과 실행
          • 스레드 제어와 생명 주기1
          • 스레드 제어와 생명 주기2
          • 메모리 가시성
          • 동기화 - synchronized
            • synchronized 키워드 이해도 체크
          • 고급 동기화 - concurrent.Lock
          • 생산자 소비자 문제1
          • 생산자 소비자 문제2
          • CAS - 동기화와 원자적 연산
          • 동시성 컬렉션
          • 스레드 풀과 Executor 프레임워크1
          • 스레드 풀과 Executor 프레임워크2
        • 김영한의 실전 자바 - 고급 2편, I/O, 네트워크, 리플렉션
          • 문자 인코딩
          • I/O 기본1
          • I/O 기본2
          • I/O 활용
          • File, Files
          • 네트워크 - 프로그램1
          • 네트워크 - 프로그램2
          • 채팅 프로그램
          • HTTP 서버 만들기
          • 리플렉션
          • 애노테이션
          • HTTP 서버 활용
        • 김영한의 실전 자바 - 고급3편, 람다, 스트림, 함형 프로그래밍
          • 람다가 필요한 이유
          • 람다
          • 함수형 인터페이스
          • 람다 활용
          • 람다 vs 익명 클래스
          • 메서드 참조
          • 스트림API1 - 기본
          • 스트림 API2 - 기능
          • 스트림 API3 - 컬렉터
          • Optional
          • 디폴트 메서드
          • 병렬 스트림
          • 함수형 프로그래밍
        • 기초 탄탄! 독하게 시작하는 Java - Part2: OOP 와 JVM
          • 2. 클래스 - 첫 번째
          • 3. 클래스 - 두번째
          • 4. 상속과 관계
          • 6. JVM(Java Virtual machine) 기본 이론
          • 7. JVM 과 GC 그리고 객체
          • 8. 불변 객체와 String 클래스
      • 책
        • 자바의 신
          • 변수
            • 클래스 변수(static) 사용 주의 케이스
            • Java volatile 과 Atomic 변수(+CAS)
          • 연산자
            • 비트 연산자 활용 예제
          • 배열
          • 참조 자료형
          • 상속
          • Object 클래스
          • interface, abstract class, enum
          • 예외
          • String 클래스
            • String 구조
            • String 문자열을 byte 로 변환하기
            • String 클래스에서 자주 사용되는 메서드
            • String 클래스로 살펴보는 불변(Immutable)객체
            • StringBuilder, StringBuffer
          • Nested 클래스
          • 어노테이션
            • 어노테이션 기본
            • 어노테이션의 사용
          • JVM 이해하기
            • 왜 JVM 을 사용해?
            • JVM, JRE, JDK
            • JVM 구조 이해하기
            • 클래스 로더 시스템
            • JIT(Just-In-Time) 컴파일러
            • GC(Garbage Collector)
              • GC Part.1
              • GC Part.2
              • GC 튜닝
          • java.lang
            • Wrapper 클래스
            • System 클래스
          • Generic
            • 제네릭 기본
            • 와일드카드
            • 와일드카드 GET / SET 경계
            • 와일드카드 extends / super 사용시기
            • 혼동할 수 있는 와일드카드 표현
          • Collection
            • 자료구조
              • 이진 탐색 트리 vs 레드 블랙 트리
            • Collection
            • List
              • ArrayList
              • Vector
              • Stack
              • LinkedList
            • Set, Queue
              • HashSet
              • LinkedHashSet
              • TreeSet
              • Priority Queue
              • ArrayDeque
            • Map
              • HashMap
              • Hashtable
              • LinkedHashMap
              • TreeMap
          • Thread
            • Thread 기본
            • Thread 와 관련이 많은, Synchronized
            • Thread 를 통제하는 메서드
            • ThreadGroup
          • I/O
            • InputStream, OutputStream
            • Reader, Writer
          • Serializable, NIO
            • Serializable
            • NIO (New IO)
          • 네트워크 프로그래밍
            • 네트워크 기본 & TCP 통신
            • UDP 통신
          • 람다
            • 함수형 인터페이스
            • 람다란?
        • 벨둥(Bealdung)
          • Java Concurrency
            • Java Concurrency Basics
              • Overview of the java.util.concurrent
              • Guide to the Synchronized Keyword in Java
              • Guide to the Volatile Keyword in Java
              • Guide to the java.util.concurrent.Future
              • ThreadLocal in Java
      • 그 외
        • 시스템 콜과 자바에서의 시스템 콜 사용례
        • 자바 NIO 의 동작원리 및 IO 모델
        • 함수형 인터페이스(FunctionInterface) - 자바8
  • Spring
    • 강의
      • 스프링 핵심 원리 - 기본편
        • 큰 흐름 잡기
        • 스프링 핵심 원리 이해1 - 예제 만들기
        • 스프링 핵심 원리 이해2 - 객체 지향 원리 적용
        • 스프링 컨테이너와 스프링 빈
        • 싱글톤 컨테이너
        • 컴포넌트 스캔
        • 의존관계 자동 주입
        • 빈 생명주기 콜백
        • 빈 스코프
      • 토비의 스프링6 - 이해와 원리
        • 3. 오브젝트와 의존관계1
        • 3. 오브젝트와 의존관계2
        • 4. 테스트
        • 5. 템플릿
        • 6.예외
        • 7. 서비스 추상화
    • 책
      • JSP 2.3 웹 프로그래밍
        • Servlet
        • JSP
        • 쿠키 / 세션
        • MVC 패턴
        • 실무 때 고민할 만한 부분
      • 스프링 입문을 위한 자바 객체지향의 원리와 이해
        • 자바와 절차적/구조적 프로그래밍
        • 객체지향의 4대 특성
        • 객체지향 설계의 5원칙
        • 스프링이 사랑한 디자인 패턴
        • IoC / DI
        • AOP(Aspect Oriented Programming), 관점 지향 프로그래밍
      • 토비의 스프링 3.1
        • Spring vs Spring Boot
        • 1. 오브젝트와 의존관계
          • 1.4 제어의 역전(IoC)
          • 1.5 스프링의 IoC
          • 1.6 싱글톤 레지스트리와 오브젝트 스코프
    • 그 외
      • 스프링 부트(SpringBoot) 탄생 배경
  • CS
    • DATA STRUCTURES
      • 선택 정렬(Selection Sort)
      • 버블 정렬(Bubble Sort)
      • 삽입 정렬(Insertion Sort)
    • OS
      • 강의
      • 책
        • 혼자 공부하는 컴퓨터구조 + 운영체제
          • 1. 컴퓨터 구조 시작하기
          • 2. 데이터
          • 3. 명령어
          • 4. CPU 의 작동원리
          • 5. CPU 성능 향상 기법
          • 6. 메모리와 캐시메모리
          • 7. 보조기억장치
          • 8. 입출력장치
          • 9. 운영체제 시작하기
          • 10. 프로세스와 스레드
    • NETWORK
      • 그 외
        • REST API
          • REST API
          • URI & MIME type
          • Collection Pattern
          • Collection Pattern 적용
          • Spring Web MVC 구현
        • SSL 인증 동작
        • DTO & JSON & CROS
          • DTO
          • 직렬화(Serialization)
          • Jackson ObjectMapper
          • CROS
        • Connection Timeout / Read Timeout
      • 강의
        • 외워서 끝내는 네트워크 핵심이론 - 기초
          • Internet 기반 네트워크 입문
            • Host 는 이렇게 외우자
            • 스위치가 하는 일과 비용
          • L2 수준에서 외울 것들
            • NIC, L2 Frame, LAN 카드 그리고 MAC 주소
            • L2 스위치에 대해서
            • LAN 과 WAN 의 경계 그리고 Broadcast
          • L3 수준에서 외울 것들
            • IPv4 주소의 기본 구조
            • L3 IP Packet 으로 외워라
            • 패킷의 생성과 전달 및 계층별 데이터 단위
            • 이해하면 인생이 바뀌는 TCP/IP 송, 수신 구조
            • IP 헤더 형식
            • 서브넷 마스크와 CIDR
            • Broadcast IP 주소와 Localhost
            • TTL 과 단편화
            • 인터넷 설정 자동화를 위한 DHCP
            • ARP 과 Ping(RTT : Round Trip Time)
          • L4 수준 대표주자 TCP 와 UDP
            • TCP 와 UDP 개요
            • TCP 연결 및 상태 변화
            • TCP 연결 종료 및 상태 변화
            • TCP, UDP 헤더 형식과 게임서버 특징
            • TCP 가 연결이라는 착각
            • TCP 연결과 게임버그
          • 웹을 이루는 핵심기술
            • DNS
            • URL, URI
        • 외워서 끝내는 네트워크 핵심 이론 - 응용
          • 네트워크 장치의 구조
            • 세 가지 네트워크 장치 구조
            • Inline 구조
            • Out of path 구조와 DPI 그리고 망중립
            • Proxy(클라이언트 입장) - 우회
            • Proxy(클라이언트 입장) - 보호와 감시
            • Reverse Proxy(서버 입장)
          • 인터넷 공유기의 작동 원리
            • 공유기 개요
            • Symmetric NAT
            • Full Cone 방식
            • Restricted Cone, Port Restricted Cone
            • 포트 포워딩
            • UPnP 와 NAT
          • 부하분산 시스템 작동 원리
            • L4 부하분산 무정지 시스템
            • 대규모 부하분산을 위한 GSLB
          • VPN과 네트워크 보안 솔루션
            • PN 과 VPN
            • IPSec VPN 과 터널링 개념
            • VPN 과 재택근무
        • 외워서 끝내는 SSL 과 최소한의 암호기술
          • 기초이론
            • Checksum (검사합)
            • Hash
          • 암호기술에 대한 이해
            • 대칭키
            • 비대칭키
          • PKI 시스템과 인터넷
            • 인터넷을 위한 비대칭키 체계
            • 공개키 신뢰를 위한 검증체계
            • 웹서비스와 공인인증서
      • 책
        • 그림으로 배우는 네트워크 원리
          • 1. 네트워크 기본
          • 2. 네트워크를 만드는 것
          • 3. 네트워크의 공통 언어 TCP/IP
    • SECURITY
      • 그 외
        • Basic Auth
        • HMAC 기반 인증
    • 그 외
      • 동기/비동기 & 블로킹/논블록킹
  • DB
    • 그 외
      • 인덱스(Index)
      • 트랜잭션(TRANSACTION)
      • 실무에서 외래키를 사용하지 않는 이유
      • ORM vs SQL Mapper
      • 문자열 vs DATE
      • EXPLAIN 명령어
    • 강의
      • Real MySQL 시즌 1
        • Part.1
          • 1강. CHAR vs VARCHAR
          • 2강. VARCHAR vs TEXT
          • 3강. COUNT(*) & COUNT(DISTINCT) 튜닝
          • 4강. 페이징 쿼리 작성
          • 5강. Stored Function
      • 토크온 41차. JPA 프로그래밍 기본 다지기
        • 1. JPA 소개
        • 2. JPA 기초와 매핑
        • 3. 필드와 컬럼 매핑
        • 4. 연관관계 매핑
        • 5. 양방향 매핑
        • 6. JPA 내부구조
        • 7. JPA 객체지향쿼리
        • 8. Spring Data JPA 와 QueryDSL 이해
    • 책
  • Software Development Methodology
    • TDD
      • 강의
        • Spring Boot TDD - 입문부터 실전까지 정확하게
          • 세션2. TDD 소개
          • 세션5. API 설계
          • 세션6. TDD 주기 첫 번째 경험
          • 세션7. TDD 주기 반복
      • 그 외
        • 단위 테스트(Unit Test) 작성의 필요성
        • JUnit5
          • A Guide to JUnit 5
          • Guide to JUnit 5 Parameterized Tests
          • AssertJ Exception Assertions
          • Testing in Spring Boot
          • Junit 과 Mockito 기반의 Spring 단위 테스트 코드 작성법
        • Code Coverage
          • Code Coverage?
    • DDD
      • 책
        • 도메인 주도 설계(Domain-Driven Design)
          • 04 - 도메인의 격리
          • 05 - 소프트웨어에서 표현되는 모델
          • 06 - 도메인 객체의 생명주기
          • 07 - 언어의 사용(확장 예제) (1)
          • 07 - 언어의 사용(확장 예제) (2)
        • 도메인 주도 개발 시작하기
          • 1. 도메인 모델 시작하기
          • 2. 아키텍처 개요
          • 3. 애그리거트
          • 4. 리포지터리와 모델 구현
            • DAO vs Repository
      • 강의
        • DDD 세레나데(NEXTSTEP)
          • 1주차
            • 도메인 주도 설계 등장 배경
            • 레거시 코드
            • 유연한 설계 - ASSERTION
          • 2주차
            • 전략적 설계 - UBIQUITOUS LANGUAGE
            • 전략적 설계 - BOUNDED CONTEXT
          • 3주차
            • 전술적 설계 - VALUE OBJECT 와 ENTITY
            • 전술적 설계 - AGGREGATE 와 REPOSITORY
            • 전술적 설계 - SERVICE
    • REFACTORING
      • 일급 컬렉션(First Class Collection) 소개와 사용해야하는 이유
  • ARCHITECTURE
    • Event Driven Architecture
  • 멘토링
    • F-Lab
      • 10회차(2024.12.29)
Powered by GitBook
On this page
  • 스트림 시작1
  • 예제1
  • 예제2
  • 스트림 시작2
  • 예제3
  • 예제 4
  • 부분으로 나누어 읽기 vs 전체 읽기
  • InputStream, OutputStream
  • 메모리 스트림
  • 콘솔 스트림
  • 정리
  • 파일 입출력과 성능 최적화1 - 하나씩 쓰기
  • 예제1 - 쓰기
  • 예제1 - 읽기
  • 정리
  • 파일 입출력과 성능 최적화2 - 버퍼 활용
  • 예제2 - 쓰기
  • 버퍼 크기에 따른 쓰기 성능
  • 예제2 - 읽기
  • 파일 입출력과 성능 최적화3 - Buffered 스트림 쓰기
  • 예제3 - 쓰기
  • 기본 스트림, 보조 스트림
  • 파일 입출력과 성능 최적화 -Buffered 스트림 읽기
  • 예제3 - 읽기
  • 버퍼를 직접 다루는 것 보다 BufferedXxx 의 성능이 떨어지는 이유
  1. Language
  2. Java
  3. 강의
  4. 김영한의 실전 자바 - 고급 2편, I/O, 네트워크, 리플렉션

I/O 기본1

Previous문자 인코딩NextI/O 기본2

Last updated 23 days ago

스트림 시작1

자바가 가진 데이터를 hello.dat 라는 파일에 저장하려면 어떻게 해야할까?

자바 프로세스가 가지고 있는 데이터를 밖으로 보내려면 출력 스트림을 사용하면 되고, 반대로 외부 데이터를 자바 프로세스 안으로 가져오려면 입력 스트림을 사용하면 된다.

참고로 각 스트림은 단반향으로 흐른다.

예제1

 package io.start;
 
 import java.io.FileInputStream;
 import java.io.FileOutputStream;
 import java.io.IOException;
 
 public class StreamStartMain1 {
      public static void main(String[] args) throws IOException {
         FileOutputStream fos = new FileOutputStream("temp/hello.dat");
         fos.write(65);
         fos.write(66);
         fos.write(67);
         fos.close();
         
         FileInputStream fis = new FileInputStream("temp/hello.dat");
         System.out.println(fis.read());
         System.out.println(fis.read());
         System.out.println(fis.read());
         System.out.println(fis.read());
         fis.close();
      }
}

new FileOutputStream("temp/hello.dat")

  • 파일에 데이터를 출력하는 스트림이다.

  • 파일이 없으면 파일을 자동으로 만들고, 데이터를 해당 파일에 저장한다.

  • 폴더를 만들지는 않기 때문에, 폴더는 미리 만들어두어야 한다.

write()

  • byte 단위로 값을 출력한다. 여기서는 65,66,67을 출력했다.

  • 참고로 ASCII 코드 집합에서 65는 A, 66은 B, 67은 C이다.

new FileInputStream("temp/hello.dat")

  • 파일에서 데이터를 읽어오는 스트림이다.

read()

  • 파일에서 데이터를 byte 단위로 하나씩 읽어온다.

  • 순서대로 65, 66, 67 을 읽어온다.

  • 파일에 끝에 도달해서 더는 읽을 내용이 없다면 -1 을 반환한다.

    • 파일의 끝 (EOF, End of File)

close()

  • 파일에 접근하는 것은 자바 입장에서 외부 자원을 사용하는 것이다.

  • 자바에서 내부 객체는 자동으로 GC 가 되지만, 외부 자원은 반드시 사용 후 닫아주어야 한다.

참고: 파일 append 옵션

FileOutputStream 의 생성자에는 append 라는 옵션이 있다.

new FileOutputStream("temp/hello.dat", true);

  • true : 기존 파일의 끝에 이어서 쓴다.

  • false : 기존 파일의 데이터를 지우고 처음부터 다시 쓴다. (기본값)

예제2

  • 입력 스트림의 read() 메서드는 파일의 끝에 도달하면 -1 을 반환한다. 따라서 -1 을 반환할 때 까지 반복문을 사용하면 파일의 데이터를 모두 읽을 수 있다.

 package io.start;
 
 import java.io.FileInputStream;
 import java.io.FileOutputStream;
 import java.io.IOException;
 
 public class StreamStartMain2 {
      public static void main(String[] args) throws IOException {
         FileOutputStream fos = new FileOutputStream("temp/hello.dat");
         fos.write(65);
         fos.write(66);
         fos.write(67);
         fos.close();
         
         FileInputStream fis = new FileInputStream("temp/hello.dat");
         int data; 
         while((data = fis.read()) != -1) {
            System.out.println(data);
         }
         fis.close();
      }
}

스트림 시작2

예제3

이번에는 byte 를 하나씩 다루는 것이 아니라, byte[] 을 사용해서 데이터를 원하는 크기 만큼 더 편리하게 저장하고 읽는 방법을 살펴보자.

package io.start;
 
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.uril.Arrays;
 
public class StreamStartMain2 {
      public static void main(String[] args) throws IOException {
         FileOutputStream fos = new FileOutputStream("temp/hello.dat");
         byte[] input = {65,66,67};
         fos.write(input); 
         fos.close();
         
         FileInputStream fis = new FileInputStream("temp/hello.dat");
         byte[] buffer = new byte[10];
         int readCount = fis.read(buffer, 0, 10);
         System.out.println("readCount = " + readCount);
         System.out.println(Arrays.toString(buffer));
         fis.close();
      }
}

출력 스트림

  • write(byte[]) : byte[] 에 원하는 데이터를 담고 write() 에 전달하면 해당 데이터를 한 번에 출력할 수 있다.

입력 스트림

  • read(byte[], offset, length) : byte[] 을 미리 만들어두고, 만들어둔 byte[] 에 한 번에 데이터를 읽어올 수 있다.

  • byte[] : 데이터가 읽혀지는 버퍼

  • offset : 데이터 기록되는 byte[] 인덱스 시작 위치

  • length : 읽어올 byte 의 최대 길이

  • 반환 값 : 버퍼에 읽은 총 바이트 수. 여기서는 3byte 를 읽었으므로 3이 반환된다. 스트림의 끝에 도달하여 더 이상 데이터가 없는 경우 -1 을 반환

read(byte[])

  • 참고로 offset, length 를 생략한 read(byte[]) 메서드도 있다. 이 메서드는 다음 값을 가진다.

    • offset : 0

    • length : buffer.length

예제 4

모든 byte 한번에 읽기

package io.start;
 
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.uril.Arrays;
 
public class StreamStartMain2 {
      public static void main(String[] args) throws IOException {
         FileOutputStream fos = new FileOutputStream("temp/hello.dat");
         byte[] input = {65,66,67};
         fos.write(input); 
         fos.close();
         
         FileInputStream fis = new FileInputStream("temp/hello.dat");
         byte[] readBytes = fis.readAllBytes(); 
         System.out.println(Arrays.toString(buffer));
         fis.close();
      }
}

부분으로 나누어 읽기 vs 전체 읽기

  • read(byte[], offset, length)

    • 스트림의 내용을 부분적으로 읽거나, 읽은 내용을 처리하면서 스트림을 계속해서 읽어야 할 경우 적합하다.

    • 메모리 사용량을 제어할 수 있다.

    • 예를 들어, 파일이나 스트림에서 일정한 크기의 데이터를 반복적으로 읽어야 할 때 유용하다. 특히, 대용량 파일을 처리할 때, 한 번에 메모리에 로드하기보다 이 메서드를 사용하여 파일을 조각조각 읽어들일 수 있다 .

    • 100MB 의 파일을 1MB 단위로 나누어 읽고 처리하는 방식을 사용하면 한 번에 최대 1MB 의 메모리만 사용한다.

  • readAllBytes()

    • 한 번의 호출로 모든 데이터를 읽을 수 있어 편리하다.

    • 작은 파일이나 메모리에 모든 내용을 올려서 처리해햐 하는 경우에 적합하다.

    • 메모리 사용량을 제어할 수 없다.

    • 큰 파일의 경우 OutOfMemoryError 가 발생할 수 있다.

InputStream, OutputStream

현대의 컴퓨터는 대부분 byte 단위로 데이터를 주고받는다. 참고롤 bit 단위는 너무 작기 때문에, byte 단위를 기본으로 사용한다. 이렇게 데이터를 주고 받는 것을 "Input / Output(I/O)" 라 한다.

자바 내부에 있는 데이터를 외부에 있는 파일에 저장하거나, 네트워크를 통해 전송하거나 콘솔에 출력할 때 모두 byte 단위로 데이터를 주고 받는다.

만약 파일, 네트워크, 콘솔 등에서 각각 데이터를 주고 받는 방식이 다르다면 상당히 불편할 것이다.

또한, 파일에 저장하던 내용을 네트워크에 전달하거나 콘솔에 출력하도록 변경할 때 너무 많은 코드를 변경해야 할 수 있다.

이런 문제를 해결하기 위해 자바는 InputStream, OutputStream 이라는 기본 추상 클래스를 제공한다.

스트림을 사용하면 파일을 사용하든, 소켓을 통해 네트워크를 사용하든 모두 일관된 방식으로 데이터를 주고 받을 수 있다. 그리고 수 많은 기본 구현 클래스들도 제공한다.

물론 각각의 구현 클래스들은 자신에게 맞는 추가 기능도 함께 제공한다.

메모리 스트림

package io.start;

import java.io.ByteArrayInputStream;
import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.util.Arrays;
 
public class ByteArrayStreamMain {
       public static void main(String[] args) throws IOException {
              byte[] input = {1, 2, 3};
                  
              // 메모리에 쓰기
              ByteArrayOutputStream baos = new ByteArrayOutputStream();
              baos.write(input);
                  
              // 메모리에서 읽기
              ByteArrayInputStream bais = new ByteArrayInputStream(baos.toByteArray());
              byte[] bytes = bais.readAllBytes();
              System.out.println(Arrays.toString(bytes));
       }
 }

실행 결과

ByteArrayOutputStream, ByteArrayInputStream 을 사용하면 메모리에 스트림을 쓰고 읽을 수 있다.

이 클래스들은 OutputStream, InputStream 을 상속받았기 때문에 부모의 기능을 모두 사용할 수 있다. 코드를 보면 파일 입출력과 매우 비슷한 것을 알 수 있다.

참고로 메모리에 어떤 데이터를 저장하고 읽을 때는 컬렉션이나 배열을 사용하면 되기 때문에, 이 기능은 잘 사용하지 않는다. 주로 스트림을 간단하게 테스트 하거나 스트림의 데이터를 확인하는 용도로 사용한다.

콘솔 스트림

package io.start;

import java.io.IOException;
import java.io.PrintStream;

import static java.nio.charset.StandardCharsets.UTF_8;

public class PrintStreamMain {
        public static void main(String[] args) throws IOException {
                PrintStream printStream = System.out;
                
                byte[] bytes = "Hello!\n".getBytes(UTF_8);
                printStream.write(bytes);
                printStream.println("Print!");
        }
}

실행 결과

우리가 자주 사용했던 System.out 이 사실은 PrintStream 이다.

이 스트림은 OutputStream 을 상속받는다.

이 스트림은 자바가 시작될 때 자동으로 만들어진다. 따라서 우리가 직접 생성하지 않는다.

  • write(byte[]) : OutputStream 부모 클래스가 제공하는 기능이다.

  • println(String) : PrintStream 이 자체적으로 제공하는 추가 기능이다.

정리

InputStream 과 OutputStream 이 다양한 스트림들을 추상화하고 기본 기능에 대한 표준을 잡아둔 덕분에 개발자는 편리하게 입출력 작업을 수행할 수 있다. 이러한 추상화의 장점은 다음과 같다.

  • 일관성 : 모든 종류의 입출력 작업에 대해 동일한 인터페이스(여기서는 부모의 메서드)를 사용할 수 있어, 코드의 일관성이 유지된다.

  • 유연성 : 실제 데이터 소스나 목적지가 무엇인지에 관계없이 동일한 방식으로 코드를 작성할 수 있다. 예를 들어, 파일, 네트워크, 메모리 등 다양한 소스에 대해 동일한 메서드를 사용할 수 있다.

  • 확장성 : 새로운 유형의 입출력 스트림을 쉽게 추가할 수 있다.

  • 재사용성 : 다양한 스트림 클래스들을 조합하여 복잡한 입출력 작업을 수행할 수 있다. 예를 들어,BufferedInputStream 을 사용하여 성능을 향상시키거나, DataInputStream 을 사용하여 기본 데이터 타입을 쉽게 읽을 수 있다. 이 부분은 뒤에서 설명한다.

  • 에러 처리 : 표준화된 예외 처리 메커니즘을 통해 일관된 방식으로 오류를 처리할 수 있다.

참고로 InputStream, OutputStream 은 추상 클래스이다. 자바 1.0부터 제공되고, 일부 작동하는 코드도 들어있기 때문에 인터페이스가 아니라 추상 클래스로 제공된다.

파일 입출력과 성능 최적화1 - 하나씩 쓰기

파일을 효과적으로 더 빨리 읽고 쓰는 방법에 대해서 알아보자.

먼저 예제에서 공통으로 사용할 상수들을 정의하자.

package io.buffered;

public class BufferedConst {
    public static final String FILE_NAME = "temp/buffered.dat";
    public static final int FILE_SIZE = 10 * 1024 * 1024; // 10MB
    public static final int BUFFER_SIZE = 8192; // 8KB
}

예제1 - 쓰기

먼저 가장 단순한 FileOutputStream 의 write() 를 사용해 1byte 씩 파일을 저장해보자.

그리고 10MB 파일을 만드는데 걸리는 시간을 확인해보자.

package io.buffered;

import java.io.FileOutputStream;
import java.io.IOException;

import static io.buffered.BufferedConst.FILE_NAME;
import static io.buffered.BufferedConst.FILE_SIZE;

public class CreateFileV1 {
    public static void main(String[] args) throws IOException {
        FileOutputStream fos = new FileOutputStream(FILE_NAME);
        long startTime = System.currentTimeMillis();
        
        for (int i = 0; i < FILE_SIZE; i++) {
            fos.write(1);
        }
        fos.close();
        
        long endTime = System.currentTimeMillis();
        System.out.println("File created: " + FILE_NAME);
        System.out.println("File size: " + FILE_SIZE / 1024 / 1024 + "MB");
        System.out.println("Time taken: " + (endTime - startTime) + "ms");
    }
}

실행 결과

  • M2 맥북 프로 기준으로 약 14초 걸린다.

예제1 - 읽기

fis.read() 를 사용해서 앞서 만든 파일에서 1byte 씩 데이터를 읽는다.

파일의 크기가 10MB 이므로 fis.read() 메서드를 약 1000만번(10 * 1024 * 1024) 호출한다.

package io.buffered;

import java.io.FileInputStream;
import java.io.IOException;
import static io.buffered.BufferedConst.FILE_NAME;

public class ReadFileV1 {
       public static void main(String[] args) throws IOException {
       FileInputStream fis = new FileInputStream(FILE_NAME);
       long startTime = System.currentTimeMillis();

       int fileSize = 0;
       int data;
       while ((data = fis.read()) != -1) {
              fileSize++;
       }
       fis.close();

       long endTime = System.currentTimeMillis();
       System.out.println("File name: " + FILE_NAME);
       System.out.println("File size: " + (fileSize / 1024 / 1024) + "MB");
       System.out.println("Time taken: " + (endTime - startTime) + "ms");
   }
}

실행 결과

  • M2 맥북 프로 기준으로 약 5초 걸린다.

정리

10MB 파일 하나 쓰는데 14초, 읽는데 5초라는 매우 오랜 시간이 걸렸다.

이렇게 오래 걸린 이유는 자바에서 1byte 씩 디스크에 데이터를 전달하기 때문이다. 디스크는 1byte 의 데이터를 받아서 1byte 의 데이터를 쓴다. 이 과정을 1000만번 반복하는 것이다.

더 자세하게 설명하면 다음 2가지 이유로 느려진다.

  • write() 나 read() 를 호출할 때마다 OS 에 시스템 콜을 통해 파일을 읽거나 쓰는 명령어를 전달한다. (이러한 시스템 콜은 상대적으로 무거운 작업이다)

  • HDD, SSD 같은 장치들도 하나의 데이터를 읽고 쓸 때마다 필요한 시간이 있다. HDD 의 경우 더욱 느린데, 물리적으로 디스크 회전 시간이 필요하기 때문

  • 이러한 무거운 작업을 무려 1000만번 반복한다.

파일 입출력과 성능 최적화2 - 버퍼 활용

이번에는 1byte 씩 데이터를 하나씩 전달하는 것이 아니라, byte[] 을 통해 배열에 담아서 한 번에 여러 byte 를 전달해보자.

예제2 - 쓰기

package io.buffered;

import java.io.FileOutputStream;
import java.io.IOException;
import static io.buffered.BufferedConst.*;

public class CreateFileV2 {
    public static void main(String[] args) throws IOException {
        FileOutputStream fos = new FileOutputStream(FILE_NAME);
        long startTime = System.currentTimeMillis();
        
        byte[] buffer = new byte[BUFFER_SIZE];
        int bufferIndex = 0;
        
        for (int i = 0; i < FILE_SIZE; i++) {
            buffer[bufferIndex++] = 1;
        
            // 버퍼가 가득 차면 쓰고, 버퍼를 비운다.
            if (bufferIndex == BUFFER_SIZE) {
                fos.write(buffer);
                bufferIndex = 0;
            }
        }
        
        // 끝 부분에 오면 버퍼가 가득차지 않고 남아있을 수 있다. 버퍼에 남은 부분 쓰기
        if (bufferIndex > 0) {
             fos.write(buffer, 0, bufferIndex);
        }
        
        fos.close();
        
        long endTime = System.currentTimeMillis();
        System.out.println("File created: " + FILE_NAME);
        System.out.println("File size: " + FILE_SIZE / 1024 / 1024 + "MB");
        System.out.println("Time taken: " + (endTime - startTime) + "ms");
    }
}
  • 데이터를 먼저 buffer 라는 byte[] 에 담아둔다.

    • 이렇게 데이터를 모아서 전달하거나 모아서 전달받는 용도로 사용하는 것을 버퍼라 한다.

  • 여기서는 BUFFER_SIZE 만큼 데이터를 모아서 write() 를 호출한다.

    • 예를 들어 BUFFER_SIZE 가 10이라면 10만큼 모이면 write() 를 호출해서 10byte 를 한번에 스트림에 전달한다.

실행 결과

  • 실행 결과의 BUFFER_SIZE 는 8192(8KB) 이다.

  • 실행 결과를 보면 이전 예제의 쓰기 결과인 14초 보다 약 1000배 정도 빠른 것을 확인할 수 있다.

버퍼 크기에 따른 쓰기 성능

BUFFER_SIZE 에 따른 쓰기 성능

  • 1 : 14368ms

  • 2 : 7474ms

  • 3 : 4829ms

  • 10 : 1692ms

  • 100 : 180ms

  • 1000 : 28ms

  • 2000 : 23ms

  • 4000 : 16ms

  • 8000 : 13ms

  • 80000 : 12ms

많은 데이터를 한 번에 전달하면 성능을 최적화 할 수 있다. 이렇게 되면 시스템 콜도 줄어들고, HDD, SSD 같은 장치 들의 작동 횟수도 줄어든다. 예를 들어 버퍼의 크기를 1 -> 2 로 변경하면 시스템 콜 횟수는 절반으로 줄어든다.

그런데 버퍼의 크기가 커진다고 해서 속도가 계속 줄어들지는 않는다.

왜냐하면, 디스크나 파일 시스템에서 데이터를 읽고쓰는 기본 단위가 보통 4KB 또는 8KB 이기 때문이다.

  • 4KB (4096 byte)

  • 8KB (8192 byte)

결국 버퍼의 많은 데이터를 담아서 보내도 디스크나 파일 시스템에서 해당 단위로 나누어 저장하기 때문에, 효율에는 한계가 있다.

따라서 버퍼의 크기는 보통 4KB, 8KB 정도로 잡는 것이 효율적이다.

예제2 - 읽기

package io.buffered;

import java.io.FileInputStream;
import java.io.IOException;

import static io.buffered.BufferedConst.BUFFER_SIZE;
import static io.buffered.BufferedConst.FILE_NAME;
    
public class ReadFileV2 {
    public static void main(String[] args) throws IOException {
        FileInputStream fis = new FileInputStream(FILE_NAME);
        long startTime = System.currentTimeMillis();
        
        byte[] buffer = new byte[BUFFER_SIZE];
        int fileSize = 0;
        int size;
        while ((size = fis.read(buffer)) != -1) {
            fileSize += size;
        }
        fis.close();
        
        long endTime = System.currentTimeMillis();
        System.out.println("File name: " + FILE_NAME);
        System.out.println("File size: " + (fileSize / 1024 / 1024) + "MB");
        System.out.println("Time taken: " + (endTime - startTime) + "ms");
   }
}

실행 결과

  • 실행 결과를 보면 읽기 예제 또한 약 1000배 정도 빠른 것을 확인할 수 있다.

버퍼를 사용하면 큰 성능 향상이 있다. 하지만 직접 버퍼를 만들고 관리해야 하는 번거로운 단점이 있다.

파일 입출력과 성능 최적화3 - Buffered 스트림 쓰기

BufferedOutputStream 은 버퍼 기능을 내부에서 대신 처리해준다. 따라서 단순한 코드를 유지하면서 버퍼를 사용하는 이점을 함께 누릴 수 있다.

예제3 - 쓰기

package io.buffered;

import java.io.BufferedOutputStream;
import java.io.FileOutputStream;
import java.io.IOException;

import static io.buffered.BufferedConst.*;

public class CreateFileV3 {
    public static void main(String[] args) throws IOException {
        FileOutputStream fos = new FileOutputStream(FILE_NAME);
        BufferedOutputStream bos = new BufferedOutputStream(fos, BUFFER_SIZE);
        long startTime = System.currentTimeMillis();
        
        for (int i = 0; i < FILE_SIZE; i++) {
            bos.write(1);
        }
        
        // 버퍼가 남아있는 상태로 close() 를 호출한다면 내부적으로 flush() 를 호출한다. 
        // 따라서 버퍼에 남아 있는 데이터를 모두 전달하고 비운다. 
        bos.close();
        
        long endTime = System.currentTimeMillis();
        System.out.println("File created: " + FILE_NAME);
        System.out.println("File size: " + FILE_SIZE / 1024 / 1024 + "MB");
        System.out.println("Time taken: " + (endTime - startTime) + "ms");
    }
}
  • BufferedOutputStream 내부에서 단순히 버퍼 기능만 제공한다. 따라서 반드시 대상 OutputStream 이 있어야 한다.

  • 여기서는 FileOutputStream 객체를 생성자에 전달한다.

  • 추가로 사용할 버퍼의 크기도 함께 전달할 수 있다.

  • 코드를 보면 버퍼를 위한 byte[] 을 직접 다루지 않고, 마치 예제1 과 같이 단순하게 코드를 작성할 수 있다.

실행 결과

  • 성능도 예제1의 14초 보다 140배 빠른 0.1초에 처리되었다.

  • 참고로 성능이 예제2 보다는 다소 떨어지는데 그 이유는 뒤어서 설명하겠다.

close()

  • BufferedOutputStream 을 close() 로 닫으면 먼저 내부에서 flush() 를 호출한다. 따라서 버퍼에 남아 있는 데이터를 모두 전달하고 비운다.

  • 따라서 close() 를 호출해도 남은 데이터를 안전하게 저장할 수 있다.

  • 버퍼가 비워지고 나면 close() 로 BufferedOutputStream 의 자원을 정리한다.

  • 그리고 나서 다음 연결된 스트림의 close() 를 호출한다. 여기서는 FileOutputStream 의 자원이 정리된다.

  • 여기서 핵심은 BufferedOutputStream.close() 를 호출하면 FileOutputStream.close() 가 연쇄적으로 호출된다는 점이다. 따라서 마지막에 연결한 BufferdOutputStream 만 닫아주면 된다.

기본 스트림, 보조 스트림

  • FileOutputStream 과 같이 단독으로 사용할 수 있는 스트림을 기본 스트림이라 한다.

  • BufferedOutputStream 과 같이 단독으로 사용할 수 없고, 보조 기능을 제공하는 스트림을 보조 스트림이라고 한다.

BufferedOutputStream 은 FileOutputStream 에 버퍼라는 보조 기능을 제공한다.

BufferedOutputStream 의 생성자를 보면 알겠지만, 반드시 FileOutputStream 같은 대상 OutputStream 이 있어야 한다.

public BufferedOutputStream(OutputStream out) { ... }
public BufferedOutputStream(OutputStream out, int size) { ... }

정리

  • BufferOutputStream 은 버퍼 기능을 제공하는 보조 스트림이다.

  • BufferOutputStream 도 OutputStream 의 자식이기 때문에 OutputStream 의 기능을 그대로 사용할 수 있다.

    • 물론 대부분의 기능은 재정의 된다. write() 의 경우 먼저 버퍼에 쌓도록 재정의 된다.

  • 버퍼의 크기만큼 데이터를 모아서 전달하기 때문에 빠른 속도로 데이터를 처리할 수 있다.

파일 입출력과 성능 최적화 -Buffered 스트림 읽기

예제3 - 읽기

package io.buffered;

import java.io.BufferedInputStream;
import java.io.FileInputStream;
import java.io.IOException;

import static io.buffered.BufferedConst.BUFFER_SIZE;
import static io.buffered.BufferedConst.FILE_NAME;

public class ReadFileV3 {
    public static void main(String[] args) throws IOException {
        FileInputStream fis = new FileInputStream(FILE_NAME);
        BufferedInputStream bis = new BufferedInputStream(fis, BUFFER_SIZE);
        long startTime = System.currentTimeMillis();
        
        int fileSize = 0;
        int data;
        while ((data = bis.read()) != -1) {
            fileSize++;
        }
        bis.close();
        
        long endTime = System.currentTimeMillis();
        System.out.println("File name: " + FILE_NAME);
        System.out.println("File size: " + (fileSize / 1024 / 1024) + "MB");
        System.out.println("Time taken: " + (endTime - startTime) + "ms");
   }
}

실행 결과

  • 예제1이 약 5초 정도 걸렸는데, 약 50배 정도 빨라진 것을 확인할 수 있다.

  • 예제2 보다는 느린데, 이 부분은 뒤에서 설명한다.

버퍼를 직접 다루는 것 보다 BufferedXxx 의 성능이 떨어지는 이유

  • 예제1 쓰기: 14000ms (14초)

  • 예제2 쓰기: 14ms (버퍼 직접 다룸)

  • 예제3 쓰기: 102ms (BufferedXxx)

예제2는 버퍼를 직접 다루는 것이고, 예제3은 BufferedXxx 라는 클래스가 대신 버퍼를 처리해준다. 버퍼를 사용하는 것은 같기 때문에, 결과적으로 예제2와 예제3은 비슷한 성능이 나와야 한다. 그런데 왜 예제2가 더 빠른 것일까?

이 이유는 동기화 때문이다.

BufferedOutputStream.write()

@Override
public void write(int b) throws IOException {
    if (lock != null) {
        lock.lock();
        try {
            implWrite(b);
        } finally {
            lock.unlock();
        }
    } else {
        synchronized (this) {
            implWrite(b);
        }
    } 
}
  • BufferedOutputStream 을 포함한 BufferedXxx 클래스는 모두 동기화 처리가 되어 있다.

  • 이번 예제의 문제는 1byte 씩 저장해서 총 10MB 를 처리해야 하는데, 이렇게 하려면 write() 를 약 1000만 번 호출해야 한다. (10 * 1024 * 1024)

  • 결과적으로 락을 걸고 푸는 코드도 1000만 번 호출된다는 뜻이다.

BufferdXxx 클래스의 특징

BufferdXxx 클래스는 자바 초창기에 만들어진 클래스인데, 처음부터 멀티 스레드를 고려해서 만든 클래스이다. 따라서 멀티 스레드에 안전하지만 락을 걸고 푸는 동기화 코드로 인해 성능이 약간 저하될 수 있다. 하지만 싱글 스레드 상황에서는 동기화 락이 필요하지 않기 때문에, 직접 버퍼를 다룰 때와 비교해서 성능이 떨어진다.

일반적인 상황이라면 이 정도 성능은 크게 문제가 되지 않기 때문에, 싱글 스레드여도 BufferedXxx 를 사용하면 충분하다. 물론 매우 큰 데이터를 다루어야 하고, 성능 최적화가 중요하다면 예제 2와 같이 직접 버퍼를 다루는 방법을 고려하자. 아쉽게도 동기화 락이 없는 BufferedXxx 클래스는 없다, 꼭 필요한 상황이라면, BufferedXxx 를 참고해서 동기화 코드를 제거한 클래스를 직접 만들어서 사용하면 된다.