Hugging Face에서 MedGemma 모델 다운로드, 세 가지 방법으로 끝내기[pe]

Hugging Face에서 MedGemma 모델 다운로드, 세 가지 방법으로 끝내기[pe]

(웹 클릭 → Python 코드 → CLI 다운로드)


  1. 사전 준비: 계정·토큰·이용 조건 동의

  1. Hugging Face 계정 만들기

  • 1단계: https://huggingface.co 에 가입하고 로그인한다.google

  • 2단계: MedGemma는 “Health AI Developer Foundations” 이용 약관에 동의해야만 파일 접근이 열린다.huggingface+1


  1. MedGemma 약관 동의


  1. Hugging Face 액세스 토큰 발급

  • 1단계: 우측 상단 프로필 → Settings → Access Tokens 메뉴로 이동.google

  • 2단계: “New token” 클릭 → 이름 설정 → 권한은 최소 read(“read access to content of all public gated repos”)로 생성.velog+1

  • 3단계: 생성된 토큰 문자열을 복사해 안전한 곳에 보관한다.velog


  1. 방법 A – Python 코드로 바로 다운로드(추천)

이 방식은 “다운로드 + 로드”를 한 번에 처리한다. transformers가 내부적으로 Hugging Face Hub에서 모델을 내려받아 ~/.cache/huggingface 에 저장한다.huggingface+1

  1. 필요 라이브러리 설치

bash
pip install -U "transformers>=4.50.0" accelerate torch huggingface_hub
  1. Python에서 Hugging Face 로그인

python
from huggingface_hub import login login("당신의_HF_토큰") # Access token 문자열
  1. 텍스트용 MedGemma 27B 다운로드+로드

python
from transformers import AutoTokenizer, AutoModelForCausalLM import torch model_id = "google/medgemma-27b-text-it" tokenizer = AutoTokenizer.from_pretrained(model_id) # 다운로드 + 캐시 model = AutoModelForCausalLM.from_pretrained( model_id, torch_dtype=torch.bfloat16, device_map="auto", )
  • 위 코드가 처음 실행될 때, medgemma-27b-text-it 가 자동으로 다운로드된다.huggingface

  • 이후에는 캐시에 저장된 파일을 재사용하므로 재다운로드가 필요 없다.arsetstudium.tistory

  1. 멀티모달 MedGemma 4B 다운로드+로드

python
from transformers import AutoProcessor, AutoModelForImageTextToText import torch model_id = "google/medgemma-1.5-4b-it" processor = AutoProcessor.from_pretrained(model_id) # 토크나이저+이미지 전처리 model = AutoModelForImageTextToText.from_pretrained( model_id, torch_dtype=torch.bfloat16, device_map="auto", )
  • 이 역시 첫 실행 시 모델이 Hugging Face Hub에서 자동 다운로드되어 로컬 캐시에 저장된다.huggingface


  1. 방법 B – huggingface-cli / hf download로 로컬 디렉터리에 받기

“모델 파일을 폴더에 통째로 받아서 관리”하고 싶다면 CLI를 쓰는 것이 좋다.google+1

  1. CLI 설치

bash
pip install "huggingface_hub[cli]"
  1. huggingface-cli 로그인

bash
huggingface-cli login # 프롬프트가 뜨면 액세스 토큰 붙여넣기
  1. hf download로 MedGemma 내려받기 (추천 방식)

bash
# 멀티모달 4B hf download google/medgemma-1.5-4b-it --local-dir ./medgemma-4b-it # 텍스트 27B hf download google/medgemma-27b-text-it --local-dir ./medgemma-27b-text-it
  • 이렇게 하면 ./medgemma-4b-it, ./medgemma-27b-text-it 폴더 안에 safetensors, config.json, tokenizer 파일 등이 모두 내려받힌다.arsetstudium.tistory+1

  • 이후 Python에서는 model_id 대신 local_dir 경로를 넣어 사용할 수 있다.

예:

python
from transformers import AutoTokenizer, AutoModelForCausalLM local_dir = "./medgemma-27b-text-it" tokenizer = AutoTokenizer.from_pretrained(local_dir) model = AutoModelForCausalLM.from_pretrained(local_dir, torch_dtype="auto", device_map="auto")

  1. 방법 C – git clone으로 레포 전체 받기 (옵션)

모델뿐 아니라 README, 추가 스크립트 등을 함께 보고 싶다면 git clone 방식도 가능하다.velog+1

  1. 개인 토큰을 포함해 git clone

bash
git clone https://<HF_아이디>:<HF_토큰>@huggingface.co/google/medgemma-1.5-4b-it
  • 보안상 .gitconfig 또는 환경변수로 토큰을 관리하는 것이 좋으며, 실제 블로그 글에는 “URL에 토큰을 그대로 넣지 말라”는 주의문구를 같이 적어 두면 안전하다.velog

  1. 로컬 디렉터리에서 사용

python
from transformers import AutoProcessor, AutoModelForImageTextToText local_dir = "./medgemma-1.5-4b-it" processor = AutoProcessor.from_pretrained(local_dir) model = AutoModelForImageTextToText.from_pretrained(local_dir, device_map="auto")

  1. Colab에서 클릭 몇 번으로 다운로드+실행까지

  1. Colab 보안 비밀(HF_TOKEN) 설정

  • Google Gemma 공식 튜토리얼처럼, Colab의 userdata 비밀로 HF 토큰을 저장하고 불러오는 패턴을 그대로 쓸 수 있다.google

Colab에서:

python
from google.colab import userdata from huggingface_hub import login hf_token = userdata.get("HF_TOKEN") login(hf_token)
  1. MedGemma 예제 코드 그대로 실행

  • 각 모델 카드에는 “How to use” 섹션에 pipeline 예제가 포함된다.huggingface+1

예: 4B 멀티모달 pipeline

python
from transformers import pipeline from PIL import Image import requests import torch pipe = pipeline( "image-text-to-text", model="google/medgemma-1.5-4b-it", torch_dtype=torch.bfloat16, device="cuda", ) img_url = "https://upload.wikimedia.org/wikipedia/commons/c/c8/Chest_Xray_PA_3-8-2010.png" image = Image.open(requests.get(img_url, headers={"User-Agent": "example"}, stream=True).raw) messages = [ {"role": "user", "content": [ {"type": "image", "image": image}, {"type": "text", "text": "Describe this X-ray."} ], } ] out = pipe(text=messages, max_new_tokens=200) print(out[0]["generated_text"][-1]["content"])
  • 이 코드 한 번 실행하면, 필요한 MedGemma 모델이 자동 다운로드되어 Colab 런타임 캐시에 저장된다.huggingface


  1. 참고문헌·사이트

(위 다운로드 절차는 MedGemma 모델 카드의 “How to use” 코드와 Gemma 공식 HF 튜토리얼, 한국어 Gemma 다운로드 블로그 글들을 합쳐 “MedGemma에 특화된 단계”로 재구성한 것이다.)google+4


  1. 요약

  • Hugging Face에서 MedGemma를 받으려면 ① HF 계정 로그인 ② MedGemma 모델 페이지에서 Health AI terms 동의 ③ Access Token 생성 후 로그인 이 세 단계를 먼저 거쳐야 한다.google+2

  • 그 다음에는 ① Python에서 from_pretrained로 자동 다운로드, ② hf download로 특정 폴더에 저장, ③ git clone으로 레포 전체를 받는 세 가지 방식 중 하나를 선택해 모델을 내려받을 수 있다.arsetstudium.tistory+2

  • Colab에서는 HF_TOKEN을 보안 비밀로 등록한 후, 모델 카드의 pipeline 예제를 그대로 실행하면 “다운로드+실행”을 한 번에 끝낼 수 있어, 블로그·강의 데모에 특히 적합하다.google+1




관련된

Hugging Face에서 모델 접근 권한 신청 방법

MedGemma용 Hugging Face 액세스 토큰 생성 절차

로컬에 MedGemma 저장할 디렉토리 구조 추천

Git LFS 필요 여부와 설치 방법

대용량 모델 다운로드 시 네트워크 설정 팁





댓글

이 블로그의 인기 게시물

히브리인, 이스라엘인, 유대인 성경 속 이름에 숨겨진 소름 돋는 비밀

작은 틈이 무너뜨린다 왜 우리는 ‘사소한 분열’을 극도로 경계해야 하는가

작은 틈이 무너뜨린다 왜 성경은 ‘분열의 시작’을 그렇게 경고하는가