본문 바로가기

Java

[Java] Java Virtual Machine (JVM)

JVM

Java Virtual Machine (JVM)이란 자바 바이트 코드를 실행할 수 있는 주체이다. 플랫폼 독립적인 구조를 갖기 위해 Virtual Machine을 구현하고 그 VM 위에서 프로그램이 작동하는 것이다. JVM의 역할은 자바 애플리케이션을 클래스 로더를 통해 읽어 들여 자바 API와 함께 실행하는 것이다. 그리고 JVM은 자바와 OS 사이에서 중개자 역할을 수행하며 자바가 OS에 구애받지 않고 재사용을 가능하게 해준다. 그리고 가장 중요한 메모리 관리, Garbage collection을 수행한다.

 

[자바 프로그램 실행 과정]

  1. 프로그램이 실행되면 JVM은 OS로부터 이 프로그램이 필요로 하는 메모리를 할당받는다.
  2. JVM은 이 메모리를 용도에 따라 여러 영역으로 나누어 관리한다.
  3. 자바 컴파일러(javac)가 자바 소스 코드(.java)를 읽어들여 자바 바이트 코드(.class)로 변환시킨다.
  4. Class loader를 통해 class 파일들을 JVM으로 로딩한다.
  5. 로딩된 class 파일들은 Execution engine을 통해 기계어로 해석된다.
  6. 해석된 바이트 코드는 Runtime Data Area에 배치되어 실질적인 수행이 이루어지게 된다.

이러한 실행 과정 속에서 JVM은 필요에 따라 Thread Synchronization과 CG같은 관리 작업을 수행한다.

자바 메모리 구조

 

 

[JVM 구성]

Class Loader (클래스 로더)

JVM내로 클래스(.class 파일)를 로드하고, 링크를 통해 배치하는 작업을 수행하는 모듈이다. Runtime 시에 동적으로 클래스를 로드한다. .jar파일 내 저장된 클래스들을 JVM 위에 탑재하고 사용하지 않는 클래스들은 메모리에서 삭제한다. 자바는 동적 코드, 컴파일 타임이 아니라 런타임에 참조한다. 즉, 클래스를 처음으로 참조할 때, 해당 클래스를 로드하고 링크한다는 것이다. 그 역할을 클래스 로더가 수행한다.

 

Excution Engine (실행 엔진)

클래스를 실행시키는 역할이다. 클래스 로더가 JVM 내의 런타임 데이터 영역에 바이트 코드를 배치시키고, 이 것은 실행 엔진에 의해 실행된다. 자바 바이트 코드는 기계가 바로 수행할 수 있는 언어보다는 비교적 인간이 보기 편한 형태로 기술된 것이다. 그래서 실행 엔진은 이와 같은 바이트 코드를 실제로 JVM 내부에서 기계가 실행할 수 있는 형태로 변경한다. 이 때, 두 가지 방식을 사용하게 된다.

  1. Interpreter (인터프리터)
  2. 실행 엔진은 자바 바이트 코드를 명령어 단위로 읽어서 실행한다. 하지만 이 방식은 인터프리터 언어의 단점을 그대로 갖고 있다. 한 줄씩 수행하기 때문에 느리다.
  3. JIT (Just In Time) Compiler
  4. 인터프리터 방식의 단점을 보완하기 위해 도입된 JIT 컴파일러이다. 인터프리터 방식으로 실행하다가 적절한 시점에 바이트 전체를 컴파일하여 네이티브 코드로 변경하고, 이후에는 해당 코드를 더이상 인터프리팅 하지 않고 네이티브 코드로 직접 실행하는 방식이다. 네이티브 코드는 캐시에 보관되기 때문에 한 번 컴파일된 코드는 빠르게 수행하게 된다. 물론 JIT 컴파일러가 컴파일하는 과정은 바이트 코드를 인터프리팅하는 것보다 훨씬 오래 걸리기 때문에 한 번만 실행되는 코드라면 인터프리팅하는 것이 유리하다. 따라서 JIT 컴파일러를 사용하는 JVM들은 내부적으로 해당 메소드가 얼마나 자주 수행되는지 체크하고, 일정 정도를 넘는 경우에만 컴파일을 수행한다.

 

Garbage Collector

메모리 관리 기능을 수행한다. 애플리케이션이 생성한 객체의 생존 여부를 판단하여 더 이상 사용되지 않는 객체를 해제하는 방식으로 메모리를 자동 관리한다.

 

[Runtime Data Area]

Runtime Data Areas & Heap Area

 

  • PC Register
  • Thread가 시작될 때 생성되며 생성될 때마다 생성되는 공간으로, 스레드마다 하나씩 존재한다. 스레드가 어떤 부분을 어떤 명령으로 실행해야 할 지에 대한 기록을 하는 부분으로 현재 수행 중인 JVM 명령의 주소를 갖는다.
  • JVM 스택 영역
  • 프로그램 실행 과정에서 임시로 할당되었다가 메소드를 빠져나가면 바로 소멸되는 특성의 데이터를 저장하기 위한 영역이다. 각종 형태의 변수나 임시 데이터, 스레드나 메소드의 정보를 저장한다. 메소드 호출 시마다 각각의 스택 프레임(그 메소드만을 위한 공간)이 생성된다. 메소드 수행이 끝나면 프레임 별로 삭제를 한다. 메소드 안에서 사용되는 값들(local variables)을 저장한다. 또한, 호출된 메소드의 매개 변수, 지역 변수, 리턴 값 및 연산 시 일어나는 값들을 임시로 저장한다.
  • Native method stack
  • 자바 프로그램이 컴파일되어 생성되는 바이트 코드가 아닌, 실제 실행할 수 있는 기계어로 작성된 프로그램을 실행시키는 영역이다. 자바가 아닌 다른 언어로 작성된 코드를 위한 공간이다. Java Native Interface를 통해 바이트 코드로 전환하여 저장하게 된다. 일반 프로그램처럼 커널이 스택을 잡아 독자적으로 프로그램을 실행시키는 영역이다. 이 부분을 통해 C 코드를 실행시켜 커널로 접근할 수 있다.
  • Method Area (= Class Area = Static Area)

    올라가는 정보의 종류
    1. Field Information
    2. 멤버 변수의 이름, 데이터 타입, 접근 제어자에 대한 정보
    3. Method Information
    4. 메소드의 이름, 리턴 타입, 매개 변수, 접근 제어자에 대한 정보
    5. Type Information
    6. class인지 interface인지 여부 저장
  •  
  •  
  • 클래스 정보를 처음 메모리 공간에 올릴 때 초기화되는 대상을 위한 메모리 공간이다. JVM에 의해서 클래스가 메모리 공간에 올라가는 순간 static으로 선언한 변수가 메모리 공간에 올라가는 것이다. 올라가는 메소드의 바이트 코드는 프로그램의 흐름을 구성하는 바이트 코드이다. 자바 프로그램은 main 메소드의 호출에서부터 계속된 메소드의 호출로 흐름을 이어가기 때문이다. 대부분 인스턴스의 생성도 메소드 내에서 명령하고 호출한다. 사실상 컴파일된 바이트 코드의 대부분이 메소드 바이트 코드이기 때문에 거의 모든 바이트 코드가 올라간다고 봐도 무방하다. 이 공간에는 Runtime Constant Pool이라는 별도의 관리 영역도 함께 존재한다. 이는 상수 자료형을 저장하여 참조하고 중복을 막는 역할을 수행한다.
  • Method Area는 클래스 데이터를 위한 공간이라면, Heap 영역은 객체를 위한 공간이다.
  • Method Area 또한 Heap 과 마찬가지로 GC의 관리 대상에 포함된다.
  1. Heap (힙 영역)
    1. Young Generation
      • Eden: 객체들이 최초로 생성되는 공간이다.
      • Survivor 0 / 1: Eden에서 참조되는 객체들이 저장되는 공간이다.
    2. 이 영역은 자바 객체가 생성되자마자 저장되고, 생성된지 얼마 안 되는 객체가 저장되는 공간이다. 시간이 지나 우선순위가 낮아지면 Old 영역으로 옮겨진다. 이 영역에서 객체가 사라질 때 Minor GC가 발생한다.
    3. Old(Tenured) Generation
    4. Young Generation 영역에서 저장되었던 객체 중 오래된 객체가 이동되어 저장되는 영역이다. 이 영역에서 객체가 사라질 때 Major GC(Full GC)가 발생한다.
  2. 객체를 저장하는 가상 메모리 공간이다. new 연산자로 생성된 객체와 배열을 저장한다. 물론 Method area 영역에 올라온 클래스들만 객체로 생성할 수 있다. 힙은 세부적으로 세 부분으로 나눌 수 있다. (Generational Algorithm에서)

 

  • Permanenet Generation (Perm)- Perm 영역의 크기로 인한 java.lang.OutOfMemoryError를 보기 힘들어졌다.
  • 생성된 객체들의 주소값이 저장된 공간이다. Class loader에 의해 load되는 class, Method 등에 대한 메타 데이터가 저장되고 JVM에 의해 사용된다. Oracle JVM에서는 이 부분은 Heap 영역이 아닌, Method 영역에 속한다고 명시되어 있다.. 그리고 Java 8부터 이 Permanent Generation 부분이 제거되고, 대신 Metaspace 영역이 추가되었다. 기존의 Perm은 JVM에 의해 크기가 강제되던 영역이었는데, Metaspace는 Native memory 영역으로, OS가 자동으로 크기를 조절한다. 임의를 크기를 조절할 수도 있다. 그 결과, 기존과 비교해 큰 메모리 영역을 사용할 수 있게 되었다.

 

 
 

 

Reference

https://stackoverflow.com/questions/2129044/java-heap-terminology-young-old-and-permanent-generations%20

https://asfirstalways.tistory.com/159

https://hoonmaro.tistory.com/19

https://asfirstalways.tistory.com/159

'Java' 카테고리의 다른 글

[Java] String Constant Pool  (1) 2022.04.02
[Java] Java Garbage Collection  (0) 2020.11.02
[Java] Garbage Collection Algorithms  (0) 2020.10.26
[Java] Immutable & Mutable  (0) 2020.10.12
[Java] Java Collections Framework(JCF)  (4) 2020.10.04