Gemma 3 270M 소개: 초효율적인 AI를 위한 콤팩트 모델

2025년 8월 14일
Olivier Lacombe Group Product Manager
Kathleen Kenealy Research Engineer

지난 몇 개월은 Gemma 개방형 모델 제품군의 전성기였습니다. Google이 출시한 Gemma 3Gemma 3 QAT는 단일 클라우드 및 데스크톱 가속기의 성능을 최첨단으로 끌어올렸고, 모바일 우선 아키텍처 Gemma 3n이 정식 출시되며 에지 기기에 강력한 실시한 멀티 모달 AI를 지원했습니다. 개발자가 AI를 제작하는 데 유용한 도구를 제공한다는 것이 저희의 변함 없는 목표이며, 여러분과 함께 구축한 Gemmaverse가 지난주 다운로드 수 2억 건을 돌파할 정도로 활발한 성과를 보인다는 사실에 감탄하지 않을 수 없습니다.

오늘 Gemma 3 툴킷에 매우 전문적인 새 도구가 하나 더 도입됩니다. 매개변수 2억 7천만 개 규모의 콤팩트 모델 Gemma 3 270M은 사전에 학습된 강력한 지시 이행 기능 및 텍스트 구조화 기능을 통해 작업별 미세 조정이 가능하도록 새롭게 설계되었습니다.

Gemma 3 270M
Gemma 3 270M은 공간 효율적인 모델에 강력한 지시 준수 기능을 제공합니다. IFEval 업계 기준치(모델이 검증 가능한 지시를 이행하는 능력을 평가)에서 알 수 있듯이, Gemma 3 270M은 동일 크기 대비 성능 등급을 새롭게 정립하여 온디바이스 및 연구 애플리케이션에서 정교한 AI 기능에 보다 쉽게 액세스할 수 있도록 지원합니다.

Gemma 3 270M의 핵심 기능

  • 콤팩트하고 유능한 아키텍처: 새로운 모델의 매개변수는 총 2억 7천만 개로, 방대한 어휘 크기에 따른 1억 7천만 개의 임베딩 매개변수와 트랜스포머 블록을 위한 1억 개의 매개변수를 포함합니다. 256,000개의 토큰으로 구성된 대형 어휘 집합 덕분에 특정 및 희귀 토큰을 처리할 수 있으므로 특정 분야 및 언어에 맞춰 한층 세밀하게 조정할 수 있는 강력한 기본 모델이 됩니다.

  • 극도의 에너지 효율: Gemma 3 270M의 주요 장점은 낮은 전력 소비량입니다. Pixel 9 Pro SoC에 대한 내부 테스트 결과, INT4 양자화 모델은 25회의 대화에서 배터리의 0.75%만 소모하여 Gemma 모델 중 가장 높은 전력 효율을 보여주었습니다.

  • 지시 이행 능력: 지시에 맞춰 조정된 모델이 사전 학습된 체크포인트와 함께 출시됩니다. 이 모델은 복잡한 대화형 사용 사례를 위해 설계된 것은 아니지만 일반적인 지시를 즉시 이행하는 강력한 모델입니다.

  • 프로덕션 레디 양자화: QAT(Quantization-Aware Trained) 체크포인트를 사용하여 성능 저하를 최소화하면서 INT4 정밀도로 모델을 실행할 수 있습니다. 이는 리소스가 제한된 기기에 배포하는 데 필수입니다.


작업에 적합한 도구

엔지니어링의 성공은 단순 성능이 아닌 효율에 따라 결정됩니다. 벽에 액자를 걸기 위해 슬레지해머를 사용할 필요가 없듯, AI 개발에도 적합한 도구가 중요합니다.

Gemma 3 270M은 이러한 '작업에 적합한 도구' 철학을 구현합니다. 지시를 즉각 이행하는 고급 파운데이션 모델은 미세 조정을 통해 진면목을 발휘합니다. 전문화를 거친 Gemma 3 270M은 놀라운 정확성, 속도, 비용 효율성으로 텍스트 분류 및 데이터 추출과 같은 작업을 실행할 수 있습니다. 콤팩트하고 유능한 모델로 시작하면 간소하고 빠르며 운영 비용이 훨씬 저렴한 프로덕션 시스템을 구축할 수 있습니다.


실제 청사진을 통해 보는 성공 사례

이러한 방법의 위력으로 인한 결과는 굉장합니다. 이를 가장 잘 보여주는 사례가 바로 SK텔레콤의 Adaptive ML입니다. 섬세한 다국어 콘텐츠 조정에 어려움을 겪자, SK텔레콤은 모델을 전문화하기로 결정했습니다. Adaptive ML은 대규모 범용 모델 대신 Gemma 3 4B 모델을 미세 조정하였고, 놀랍게도 전문화된 Gemma 모델은 특정 작업에서 규모가 훨씬 큰 독점 모델을 뛰어넘는 성능을 보여주었습니다.

Gemma 3 270M은 개발자가 이러한 방식에서 나아가 잘 정의된 작업의 효율성을 더욱 높일 수 있도록 설계되었습니다. 각자의 작업에 특화된 작고 전문적인 여러 모델들을 구축하는 데 완벽한 출발점입니다.

물론 전문화는 엔터프라이즈급 작업뿐만 아니라, 창의적인 애플리케이션 작업에도 탁월한 성능을 발휘합니다. 다음의 Bedtime Story Generator 웹 앱이 하나의 예시입니다.

Link to Youtube Video (visible only when JS is disabled)

Gemma 3 270M을 기반으로 Transformers.js를 사용하여 제작된 Bedtime Story Generator 웹 앱입니다. 모델의 크기와 성능은 오프라인 웹 기반 창의적 작업에 적합합니다(출처: Hugging Face 팀의 Joshua(X: @ xenovacom)).

Gemma 3 270M을 사용해야 하는 경우

Gemma 3 270M은 Gemma 3 컬렉션의 고급 아키텍처와 탄탄한 사전 학습을 이어받아 맞춤형 애플리케이션에 강력한 기반을 제공합니다.

이러한 Gemma 3 270M을 사용하는 것이 가장 적합한 경우에 대해 알아보겠습니다.

  • 잘 정의된 대용량 작업이 있는 경우: 감정 분석, 항목 추출, 쿼리 라우팅, 비정형 텍스트를 구조화된 텍스트로 처리하기, 창의적 글쓰기, 규정 준수 확인을 비롯한 기능에 적합합니다.

  • 시간 및 비용 효율성을 높이려는 경우: 프로덕션 시 추론 비용을 크게 줄이거나 제거하고 사용자에게 더 빠른 응답을 제공합니다. 미세 조정된 270M 모델은 가볍고 저렴한 인프라에서는 물론 온디바이스로도 직접 실행할 수 있습니다.

  • 신속한 반복 및 배포가 필요한 경우: Gemma 3 270M의 작은 크기 덕분에 신속한 미세 조정 실험이 가능하여 며칠이 아닌 몇 시간 만에 사용 사례에 완벽한 구성을 찾을 수 있습니다.

  • 사용자의 개인 정보를 보호해야 하는 경우: 모델을 온디바이스로 실행할 수 있기 때문에 클라우드로 데이터를 전송하지 않고도 민감한 정보를 처리하는 애플리케이션을 제작할 수 있습니다.

  • 전문화된 여러 작업 모델이 필요한 경우: 예산 내에서 각기 다른 작업을 위해 전문적으로 훈련된 여러 맞춤 모델을 제작하고 배포할 수 있습니다.


미세 조정 시작하기

Gemma 3 270M으로 여러분의 맞춤 솔루션을 구현하는 일은 어렵지 않습니다. Gemma 3 270M은 다른 Gemma 3 모델과 동일한 아키텍처를 기반으로 하며, 빠른 시작을 돕는 레시피 및 도구가 제공됩니다. Gemma 3 270M을 이용한 전체 미세 조정에 관한 가이드는 Gemma 문서에서 찾으실 수 있습니다.

  • 모델 다운로드하기: Hugging Face, Ollama, Kaggle, LM Studio 또는 Docker에서 Gemma 3 270M 모델을 다운로드합니다. 사전 학습된 모델과 지시에 따라 조정된 모델이 모두 출시됩니다.

  • 솔루션 배포하기: 미세 조정을 완료하면 로컬 환경부터 Google Cloud Run까지 어디에서나 전문화된 모델을 배포할 수 있습니다.

Gemmaverse의 기본 철학은 크기에 구애받지 않는 혁신의 추구입니다. Gemma 3 270M은 개발자 여러분이 더욱 스마트하고, 빠르고, 효율적인 AI 솔루션을 제작할 수 있도록 지원합니다. 앞으로 여러분이 제작할 전문화된 모델을 기대하겠습니다.