less than 1 minute read

Ray: multi-processing library

ray는 파이썬 멀티프로세싱 라이브러리입니다. 파이썬에서 기본적으로 제공되는 multiprocessing 라이브러리가 있지만, 그보다 더 간단하고 더 빠른 멀티프로세싱을 제공하기 위해 제작되고 있는 오픈소스 프로젝트입니다.

  • ray는 cpu 수가 많은 환경일수록 더 빠르다고 알려져 있음
  • 로컬 환경, 클라우드의 쿠버네티스(AWS, GCP, Azure) 환경, 온프레미스 쿠버네티스 등 다양한 환경에서 사용할 수 있음
  • 사용법이 쉬움
  • 프로젝트 링크: https://github.com/ray-project/ray

Installation

$ pip install ray

Quick Start

ray는 아래 코드와 같이 간단하게 사용 가능합니다.

import ray
import psutil

num_workers = psutil.cpu_count()
ray.init(num_cpus=num_workers)

@ray.remote
def f(x):
    return x * x

futures = [f.remote(i) for i in range(4)]
print(ray.get(futures))

위 코드와 같이 기존 함수를 @ray.remote 데코레이터로 감싸고 호출시 [FUNC_NAME].remote()로 호출하면 됩니다.
주의할 점은 remote() 호출 이후 get()을 꼭 호출해야 원하는 결과값을 얻을 수 있습니다.

  • 주의할 점

get() 호출은 최대한 적게하는 것이 좋습니다. for문 안에서 remote() 호출 할때마다 get()을 호출하게 되면 프로그램 실행속도가 상당히 느려지게 됩니다.


이 외에도 ray 대쉬보드, class에서의 ray 사용 등 다룰 것은 많지만 개인적으로 함수를 데코레이터로 감싸서 쓰는 방식이 가장 간단하면서 쓰임이 좋은 것 같습니다.

Leave a comment