Python/ETC

[파이썬 기본 다지기] 파이썬에서 print("Hello, world")는 어떻게 나오는 걸까? 파이썬의 실행 방식 간략하게 알아보기

Kani Kim 2023. 4. 6. 11:23

1. 파이썬이란?

1-1. 파이썬은 크게 두가지 의미에서 사용된다

  • 프로그래밍 언어 Python의 언어 사양 - 문법이나 작동방식등을 모아둔 것
  • 언어의 사양에 따른 처리방식의 대표격 CPython
    • 귀도 반 로섬이 개발한 본체 CPython의 처리계통을 말한다.
    • 이번 글에서는 CPython을 기준으로 운영체제는 리눅스(도커)를 사용한다.

1-2. 그 외의 파이썬 인터프리터 예시

  • PyPy : 파이썬으로 실행되는 파이썬
  • Jython : 자바로 실행되는 파이썬
  • Pyodide : WebAssembly를 대상으로 하는 파이썬

2. 프로그래밍 언어의 실행방식

2-1. 인터프리터 방식

  • 소스 코드를 한줄 씩 읽어가며 순차적으로 해석하며 움직이는 실행방식
    • 이 순차 해석을 실행하는 프로그램을 인터프리터라고 부른다
    • 스크립트 형식의 언어에 많이 사용되며, Python, Ruby, JavaScript 등이 있다.

2-2. 컴파일 방식

  • 소스코드를 사전에 기계어로 변환 - 컴파일 - 하고나서 실행하는 방식
    • C, C++, Go, Rust등이 있다.

하지만 위의 방식들은 어디까지나 간단하게 범주를 나눈 것으로, 실제로는 입력 형식이나 결과물에 따라 다양한 중간 표현식도 자주 사용.


3. 파이썬이 실행될 때에 대한 간략한 개요

def hello():
	#This is a comment line
    print("Hello, world")
    
if __name__ == "__main__":
	hello()​

3-1. 프로그래밍 언어와 소스 코드

  • 프로그램의 소스코드는 다른 문자열
  • 문자열에 의미를 가지게 하는 것을 언어라고 부른다
    • 예를 들어 "1+2"는 수식인지, 한국어인지, 파이썬의 코드인지 아니면 자바스크립트의 코드인지 모른다.
    • 언어에 따라 같은 문자열이라도 해석이 달라진다
  • 언어 중에서도 특히 컴퓨터에게 해석을 부탁하는 것이 프로그래밍 언어

 

3-2. 프로그래밍 언어와 추상구문트리

  • 프로그래밍 언어는 소스코드의 문자열을 해체해서 컴퓨터가 해석하기 쉬운 형식으로 교환하는 것이 필수적이라고 볼 수 있다.
    • 이 교환을 하는 과정을 Parse(파스)라고 부르며, 이것을 실행하는 것을 Parser(파서)라고 부른다
    • 컴퓨터가 해석하기 쉬운 형태 = Abstract Syntax Tree, AST
  • 프로그래밍언어는 인간이 AST를 구축하기 쉽게 하기위해 존재한다.
  • 이때 파이썬의 파서는 파이썬 3.9 이전과 이후로 나뉜다. 
    • 파이썬 3.9부터는 PEG - Parsing Expression Grammer, PEP617 - 파서를 사용한다.
    • 그 이전에는 LL(1)파서가 이용되었고, 이 파서는 Python 3.10에서 삭제된다.
    • 이 글에서는 3.11.0을 사용한다
  • 주된 흐름은 "구문분석 -> 토큰화 -> 추상화 -> AST -> 컴파일 -> 바이트 코드 -> 실행"으로 이루어진다.
  • 이때 토큰화를 할 때, Tokenize Module이 그 역할을 해준다.
    • 표준 라이브러리인 tokenize모듈은 파이썬 소스코드를 토큰으로 분해해서 출력한다.
    • 토큰은 의미를 가지는 최소 단위

  • 그 후 추상화를 할 때, AST Module이 그 역할을 해준다.
    • 표준 라이브러리인 AST모듈은 파이썬 소스코드를 추상화해서 출력한다.
    • AST는 프로그램으로서 의미를 가지는 정보를 구조체로 표현한 것으로, 이 때 주석은 포함되지 않는다.

  • 그 후 바이크 코드로 변환할 때, dis Module이 그 역할을 해준다.
    • 파이썬 바이트 코드를 역 어셈블한(합친) 결과를 출력
    • 파이썬 바이트 코드는 Python VM(가상머신)이 해석한 기계어

정리하자면 다음과 같다

"구문분석 -> 토큰화(tokenize Module)->

 추상화 -> AST(AST Module) ->

 컴파일 -> 바이트 코드(dis Module) -> 실행"

 

3.2 파이썬 가상머신에 의한 바이트코드 실행

  • 파이썬 가상머신은 파이썬의 바이트 코드를 순차 실행하는 가상 머신이다.
    • 실제 컴퓨터에서는 CPU가 메모리상의 기계어를 순차실행하고 있다.
    • 실제 코드는 Python/ceval.c에 기술되어 있는 거대한 루프이다.
    • 기억 영역에 스택 구조를 사용하는 스택 머신이라고 불리는 계산 모델이다.
728x90
반응형