| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
- CS
- 한 권으로 읽는 컴퓨터 구조와 프로그래밍
- JP Study
- 멀티스레딩
- WIL
- java
- 엘런 튜링
- 혼자 공부하는 SQL
- 다시 왔다!
- 1463
- computer science
- 1기
- 컴퓨터 과학이 여는 세계
- mysql
- 원티드 포텐업
- FastAPI
- Programmers
- 프로그래머스
- 백준
- 백엔드
- 2023
- MVT
- 퓨처셀프
- 미래혁신대전
- servlet
- Recommender system
- SQL
- Spring Boot
- Til
- Django
- Today
- Total
Growth Hoon
[Java] JVM Deep하게 알아보기 본문
JVM이란 ?
JVM은 Java Virtual Machine으로 ‘자바를 실행하기 위한 가상 머신’이다.
JVM은 운영체제(OS)에서 직접 실행되지 않고, JVM 위에서 돌아가도록 해주는 가상의 실행 환경이다.
Java는 OS에 종속적이지 않다는 특징을 가지고 있는데,
OS에 종속받지 않고 실행되기 위해서는 OS위에 Java를 실행시킬 무언가가 필요하다. 그게 바로 JVM이다.
즉, OS에 종속받지 않고 CPU가 Java를 인식, 실행할 수 있게 하는 가상 컴퓨터이다.

컴퓨터가 Java를 이해하는 과정
전체 맥락
Java 소스코드(*.java)는 CPU가 인식하지 못하므로, 기계어로 컴파일을 해줘야한다.
하지만, Java는 JVM을 거쳐서 기계어로 컴파일하여 CPU로 보내주는기 때문에Java 소스코드(*.java)는 JVM이 인식할 수 있도록 변환되어야 한다.
- Java 소스코드 → JVM : JVM이 인식할 수 있도록 컴파일
- JVM → CPU : CPU가 인식 할 수 있도록 기계어로 컴파일
JVM이 인식할 수 있도록 컴파일
JVM이 인식할 수 있도록 Java 소스코드를 JVM이 인식할 수 있는 *.class파일로 변환해야 하는데, 이 역할을 하는 것이 Java Compiler이다.
💡여기서 Java Complier는 JDK를 설치하면 bin에 존재하는 **javac.exe**를 의미한다.
즉, JDK를 설치하면 컴파일러가 같이 다운로드 된다는 의미이다.
- javac 명령어를 통해서 .java를 직접 .class로 컴파일 할 수도 있다.
*.class 파일은 Java Bytecode로 변환이 되는데, 이는 기계어가 아니기 때문에 OS에서 바로 실행이 되지 않는다.
이 Bytecode를 이해할 수 있도록 해석(Compile)해주는 것이 JVM이고, 이로 인해서 Java는 OS에 상관 없이 실행 될 수 있는 것이다.
→ OS에 종속적이지 않고, Java파일 하나만 만들면 어느 디바이스든 JVM위에서 실행할 수 있다.
가상 컴퓨터(VM)에서 돌아가는 실행 프로그램을 위한 이진 표현법.
Java Bytecode는 JVM이 이해할 수 있는 언어로 변환된 자바 소스코드를 의미한다. Java Compiler에 의해 변환된 코드의 명령어 크기가 1Byte라서 Java Bytecode라고 불리고 있다.
Bytecode는 다시 실시간 번역기(JIT Compiler)에 의해 Binary 코드로 변환된다.
- Binary 코드란?
컴퓨터가 인식할 수 있는 0과 1로 구성된 이진코드 - 기계어란?
→ 기계어가 이진코드로 이루어졌을 뿐 모든 이진코드가 기계어인 것은 아니다.
→ 기계어는 특정한 언어가 아니라 CPU가 이해하는 명령어 집합이며, CPU 제조사마다 기계어가 다를 수 있다.
0과 1로 이루어진 Binary 코드 - 정리
VM이 이해할 수 있는 코드 : Byte 코드
CPU가 이해하는 언어 : Binary 코드
JIT Compiler란 무엇인가
JIT 컴파일(Just-In-Time compliation) 또는 **동적 변역(dynamic translation)**이라고 한다. JIT 컴파일러는 프로그램을 실행하는 시점에 기계어로 번역하는 컴파일러이다.
→ 즉, JVM에서 CPU로 인식할 수 있도록 도와주는 컴파일러이다.
Interpreter 방식의 단점을 보완하기 위해서 도입되었다.
Interpreter 방식으로 실행하다가 적절한 시점에 Bytecode 전체를 컴파일하여 기계어로 변경하고, 이후에는 더 이상 Interpreting하지 않고 기계어로 직접 실행하는 방식이다.
→ Q. 근데 이럴거면 그냥 처음부터 컴파일 하면 안되는건가 ?
→ A. 기계어(컴파일 된 코드)는 캐시에 보관하기 때문에 한 번 컴파일 된 코드는 빠르게 수행이 되지만, JIT가 기계어로 컴파일 하는 시간이 Interpreter하는 과정보다 훨씬 오래 걸리 때문에 한번만 실행이 되는 코드라면 컴파일 하지 않고 Interpreting하는 것이 훨씬 유리하다.
전체적인 맥락 정리
자바 소스코드(*.java) → Java Compiler를 통해 Bytecode로 변환 (javac.exe) → JVM에서 Bytecode를 인식한 후 JIT Compiler를 이용하여 Binarycode(기계어)로 변환 → CPU에서 코드 수행
JVM 구성요소

JVM의 아키텍처
JVM 아키텍처에는 3가지 주요 하위 시스템이 있다.
- Class Loader
- Runtime Data Area (Memory area)
- Execution Engine
해당 챕터에서는 위 3가지 하위 시스템에 대해서 알아볼 것이다.
1. Class Loader

Java에 내장되어있는 Class Loader는 3가지가 있다
- Bootstrap Class Loader
- Extension Class Loader의 상위 Class Loader로 rt.jar 파일을 로드한다.
- Extension Class Loader
- 디렉토리에 있는 jar파일을 로드하는 Class Loader이다.
- Bootstrap Class Loader의 자식이며, System Class Loader의 부모이다.
- Application/System Class Loader
- class path에 있는 class 파일들을 로드하는 Class Loader이다.
Class Loader에는 중요한 3가지가 있다.
Initialization , Linking , Loading 이다.
- Initialization
- 이 작업은 프로그램 블록 내의 모든 static 변수에 특정 값을 할당하는 작업이 포함된다
- 이 단계에서 코드와 static 블록에 정의된 값을 모든 정적 변수에 할당한다.
- 초기화 작업은 소스코드의 위에서 아래로, 클래스 계층구조에서는 부모 클래스에서 자식 방향으로 할당을 한다.
- Loading
- 보조 메모리(HDD)에서 주 메모리(RAM)로 파일을 로드한다.
- Class Loader는 .class(Java Compiler로 인해 변환된 파일)파일을 읽고, 해당 binary 데이터를 생성하여 Method area에 저장한다.
- JVM은 Method area에 각 .class파일의 정보를 저장한다
- 로드된 클래스와 바로 위의 부모 클래스의 정규화 된 이름
- .class파일이 interface, enum, class 중 어떤 형식으로 되어있는지
- 수정자(Modifier), 변수 및 메서드 정보 등
- .class 파일을 로드한 후, JVM은 Heap 메모리 영역에 있는 이 파일을 나타내는 Class유형의 객체를 생성한다.
- 프로그래머는 이 Class객체를 사용하여 클래스 이름, 부모 이름, 메서드, 변수 정보 등 Class 수준의 정보를 얻을 수 있다.
- Linking
이 작업은 메인 프로그램의 여러 파일을 하나로 결합한다. 이 과정에서 verification, preparation, resoultion(optional)을 수행한다.
- Verification
- .class 파일의 생성 및 구성이 유효한 컴파일러에 의해 이루어졌는지 확인한다
- 실패하는 경우 java.lang.Verify 예외가 발생한다
- Preparation
- JVM은 Class변수에 대한 메모리를 할당하고 메모리를 기본값으로 초기화한다.
- resolution
- symbolic 참조를 direct 참조로 대체하는 프로세스
- Method area를 검색해서 참조된 Entity를 찾는다.
- Verification
Class Loader는 Runtime시 동적으로 Class를 로드하고 jar파일 내 저장된 Class들을 JVM에 탑재한다. → Class를 처음 참조할 때, 해당 Class를 로드하고 링크하는 역할을 하는 것 !
2. Runtime Data Area (Memory Area)

프로그램을 수행하기 위해서 OS에서 할당받은 메모리 공간이다.
- Method Area (= Class Area, Static Area)
- Class 정보를 처음 메모리 공간에 올릴 때, 초기화되는 대상을 저장하기 위한 메모리 공간.
- method data, field data, runtime pool, meta data와 같은 각 class의 구조를 저장한다
- Heap
- 객체 할당이 발생하는 런타임 영역이다. 즉, 객체를 저장하는 가상메모리 공간이다.
- new 연산자를 통해서 생성되는 객체(Object)와 배열을 저장한다.
- Heap 구조에 대해서 깊게 알아보기
- Stack
- 프로그램의 부분적인 결과와 local 변수(Method안에서 사용되는 값)를 저장한다.
- 스레드가 생성될 때마다 JVM Stack이 동시에 생성된다.
- Method를 호출하면 호출 프로세스가 완료되는 동시에 새로운 Stack frame이 생성되고 사라진다.
- PC Registers
- Thread가 시작될 때 생성되며, Thread마다 하나씩 존재한다.
- Thread가 어떤 부분을 어떤 명령으로 실행해야할지에 대한 기록을 하는 부분으로, 현재 실행중인 JVM 명령어의 주소를 저장한다.
- Native Method Stacks
- 자바 프로그램이 컴파일 되어 생성되는 Bytecode가 아닌 실제 수행할 수 있는 기계어로 작성된 프로그램을 실행시키는 영역
- 모든 Application에 필요한 Native method를 저장한다.

- Permanent Generation
- 영구적인 세대로 생성된 객체들의 정보의 주소값이 저장된 공간이다.
- Class Loader에 의해 load되는 Class, Method등의 메타정보가 저장되는 영역이다.
- Reflection을 사용하여 동적으로 Class가 로딩되는 경우 사용한다.
- New/Young Generation
- 이곳의 인스턴스들은 추후 GC(Garbage Collector)에 의해서 사라진다.
- 생명 주기가 짧은 “젋은 객체”를 GC 대상으로 하는 영역이다.
- 여기서 일어나는 GC를 “Minor GC”라고 한다.
- Tenured Generation (Old area)
- 이곳의 인스턴스들은 추후 GC에 의해 사라진다.
- 여기서 일어나는 GC를 Major GC라고 한다. Minor GC에 비해 속도가 느리다.
- New/Young Area에서 일정시간 참조되고 있는, 살아남은 객체들이 저장되는 공간이다.
3. Execution Engine

Class를 실행시키는 역할로 Class Loader가 Runtime Data Area에 Bytecode를 배치시킨다. 이렇게 Runtime Data Area에 올라온 Bytecode들은 Execution Engine에 의해 실행이 된다.
→ 즉, Runtime Data Area에서 데이터를 읽고 명령어를 수행하는 엔진이다.
- Interpreter
- Bytecode Stream을 읽은 후 명령어를 실행한다. ( 명령어 단위로 읽어서 실행한다 )
- 한줄씩 실행하기 때문에 느리다는 단점이 있다.
- JIT Compiler
- 유사한 기능을 가진 Bytecode의 여러 부분을 동시에 컴파일하여 컴파일 시간을 단축한다.
- Interpreter방식으로 실행하다가 적절한 시점에 Bytecode로 전체를 컴파일하여 기계어로 변경하고, 컴파일 된 내용들은 기계어로 실행이 된다.
- Garbage Collector
- 더이상 사용되지 않는 인스턴슬르 찾아 메모리에서 삭제한다.
Java는 Interpreter방식과 Compile방식을 혼합하여 사용하는 프로그래밍 언어이다.
Reference
- https://doozi0316.tistory.com/entry/1주차-JVM은-무엇이며-자바-코드는-어떻게-실행하는-것인가
- https://techvidvan.com/tutorials/java-virtual-machine/ e/
- https://chatgpt.com/share/68ceca97-9318-800d-b0c0-53762431dddf
부록
JVM 메모리 구조에는 “Heap 영역”, “Stack 영역”, “Method 영역” 으로 나눠져있다.
그 중에서 Stack 영역은 메서드 호출과 관련된 실행 정보를 저장하는 공간이다.
→ 여기서 중요한 개념이 StackFrame이다.
1. Stack 영역
- 스레드마다 하나씩 독립적으로 생성됨 (즉, Thread-Local 메모리).
- 메서드가 호출될 때마다 **"Stack Frame"**이라는 단위가 스택에 push되고, 메서드가 끝나면 pop됨.
- 따라서 "후입선출(LIFO)" 구조를 가짐.
2. Stack Frame이란?
Stack Frame = 메서드 실행에 필요한 정보 묶음
메서드가 호출될 때 JVM이 만들어서 스택에 올리고, 메서드가 끝나면 사라지는 단위.
Stack Frame에 들어가는 정보
- Local Variables (지역 변수 배열)
- 메서드 매개변수
- 지역 변수
- 참조 변수 (객체는 Heap에 있고, 그 주소(참조)만 저장됨)
- Operand Stack (연산 스택)
- 바이트코드 명령어들이 계산을 수행할 때 임시로 값을 쌓아두는 공간
- 예: i + j를 실행할 때, i와 j 값을 여기 올려놓고 덧셈 후 결과를 다시 올림
- Frame Data (메서드 실행 상태 정보)
- 메서드를 호출한 쪽(Caller)으로 돌아가
Stack 영역과 Stack Frame을 연결하는 개념이 Call Stack이다.
1. Call Stack이란?
- 현재 실행 중인 메서드들이 쌓여 있는 Stack Frame들의 모음
- 즉, 스레드가 어떤 메서드를 어떤 순서로 호출했는지 기록한 실행 스택
- 보통 우리가 "Stack Trace" 라고 보는 것도 사실상 Call Stack의 스냅샷
2. 관계 정리
- Stack 영역: JVM이 스레드마다 하나씩 가지는 메모리 영역
- Stack Frame: 메서드 실행 단위로 Stack에 push/pop 되는 박스
- Call Stack: 지금까지 쌓여 있는 Stack Frame들의 "목록" (= 메서드 호출 경로)
단순하게 실행 중인 프로그램(Program)
사용자가 작성한 프로그램이 운영체제에 의해 메모리 공간을 할당받아 실행 중인 것을 말한다.
프로세스는 프로그램에 사용되는 데이터와 메모리 등의 자원 그리고 스레드로 구성된다.
프로세스(Process)내에서 실제로 작업을 수행하는 주체를 의미한다.
모든 프로세스는 한 개 이상의 스레드가 존재하여 작업을 수행한다.
2개 이상의 스레들르 가지는 프로세스를 **멀티스레드 프로세스(multi-threaded process)**라고 한다.
Method area에 존재하는 별도의 영역으로 상수 자료형을 저장하고 참조하고 중복을 막는 역할을 수행
객체를 통해 Class의 정보를 분석해내는 프로그래밍 기법이다.
구체적인 클래스 타입을 알지 못해도 컴파일된 Bytecode를 통해서 역으로 클래스의 정보를 알아내어 사용한다는 의미이다.
Eden
- 객체들이 최초로 생성되는 공간
Survivor 0, 1
- Eden에서 참조되는 객체들이 저장되는 공간
Eden영역에 객체가 가득차게 되면 첫번째 GC가 발생한다.
Eden영역에 있는 값들을 Survivor 1영역에 복사하고 이 영역을 제외한 나머지 객체를 삭제한다.
'Program_Language > Java' 카테고리의 다른 글
| [Servlet] Tomcat을 알아보자 (1) | 2025.10.28 |
|---|---|
| [Servlet] Servlet의 등장 (2) | 2025.10.27 |