구글은 2024년 초 기존 Bard 서비스를 Gemini로 리브랜딩하며, 개발자들을 위해 Gemini API를 공식 제공하기 시작했습니다. 이제 더 이상 비공식 라이브러리에 의존할 필요 없이, Google Cloud를 통해 안정적으로 Gemini 모델을 불러올 수 있습니다. 이 글에서는 Gemini API 사용방법을 단계별로 정리했습니다. 키 발급 방법부터 파이썬 코드 예제, 자주 쓰이는 기능까지 꼼꼼히 살펴보겠습니다.
1. 제미나이(Gemini) API란?
Gemini API는 구글이 개발한 초거대 언어 모델을 애플리케이션이나 서비스에 쉽게 연결할 수 있도록 제공하는 공식 인터페이스입니다. Bard 시절에는 웹 기반 챗봇 중심이었으나, 이제는 개발자가 직접 텍스트 생성, 요약, 번역, 이미지 분석, 멀티모달 입력 등을 코드로 호출할 수 있습니다.
Gemini는 모델 크기에 따라 Ultra, Pro, Nano 라인업으로 나뉘며, 현재 API에서는 Gemini 1.5 Pro / Gemini 1.5 Flash 같은 모델이 제공됩니다. Pro는 고품질 답변에 적합하고, Flash는 가볍고 빠른 응답을 원할 때 유리합니다.
2. Gemini API 키 발급 방법
Gemini API를 사용하려면 먼저 Google Cloud 계정과 프로젝트가 필요합니다.
1) Google Cloud Console 로그인
2) 새로운 프로젝트 생성 또는 기존 프로젝트 선택
3) API 및 서비스 → 라이브러리 메뉴에서 “Gemini API” 검색 후 사용 설정
4) API 및 서비스 → 사용자 인증 정보 메뉴에서 “API 키 만들기” 클릭
5) 발급된 API 키를 안전하게 보관 (환경변수/.env 파일 권장)
⚠️ 주의: API 키는 계정 요금과 연결되므로 절대 코드에 직접 노출하지 말고, 깃허브 등에 업로드하지 않도록 주의하세요.
3. 파이썬 환경 설정
구글은 Gemini API 사용을 위해 google-generativeai 라는 공식 파이썬 라이브러리를 제공합니다. 설치는 매우 간단합니다.
pip install google-generativeai
설치 후, 환경변수에 API 키를 등록하거나 코드에서 불러올 수 있습니다.
# .env 파일 예시 GEMINI_API_KEY="여기에_발급받은_API키"
4. 기본 텍스트 생성 예제
아래는 가장 기본적인 텍스트 생성 예제입니다. 모델에 질문을 입력하면, 자연어로 답변을 돌려줍니다.
import os import google.generativeai as genai # API 키 불러오기 api_key = os.getenv("GEMINI_API_KEY") genai.configure(api_key=api_key) # 모델 불러오기 model = genai.GenerativeModel("gemini-1.5-pro") # 프롬프트 보내기 response = model.generate_content("인공지능이 교육 분야에 미치는 영향에 대해 3가지로 정리해줘.") print(response.text)
위 코드에서 gemini-1.5-pro 대신 gemini-1.5-flash를 사용하면 속도가 더 빠릅니다.
5. 대화형(Chat) 모드 예제
Gemini는 대화 상태를 유지하면서 여러 차례 질의응답을 주고받을 수 있습니다.
chat = model.start_chat(history=[]) res1 = chat.send_message("안녕! 너는 무엇을 할 수 있니?") print(res1.text) res2 = chat.send_message("그럼 오늘 서울 날씨를 알려줄래?") print(res2.text)
이 방식은 챗봇 형태의 애플리케이션을 구현할 때 유용합니다.
6. 이미지 + 텍스트 멀티모달 입력
Gemini의 특징 중 하나는 멀티모달 지원입니다. 이미지와 텍스트를 함께 입력해 질문할 수 있습니다.
from PIL import Image img = Image.open("sample.jpg") response = model.generate_content( ["이 사진에서 보이는 음식은 무엇인가요?", img] ) print(response.text)
예를 들어 음식 사진을 넣고 “칼로리가 높을까?”라고 묻거나, 그래프 이미지를 분석하도록 할 수 있습니다.
7. 요금과 사용량 관리
Gemini API는 과금형 서비스이므로 사용량 관리가 중요합니다. - 기본적으로 신규 계정에는 일정량의 무료 크레딧이 제공됩니다.
- 이후에는 모델별 토큰 단위로 과금되며, 요청 길이와 응답 길이에 따라 비용이 달라집니다.
- Google Cloud Console에서 Usage(사용량)과 Billing(결제) 메뉴에서 실시간 확인 가능합니다.
8. 자주 발생하는 오류와 해결 방법
1) 401 Unauthorized → API 키가 잘못되었거나 등록되지 않았을 때 발생합니다.
2) 403 Forbidden → 프로젝트에서 Gemini API 사용 설정이 안 되어 있거나 권한이 없는 경우입니다.
3) Rate limit 초과 → 너무 많은 요청을 보낸 경우, 쿼터를 늘리거나 요청 간격을 조정하세요.
4) JSONDecodeError → 응답을 JSON으로 파싱하려 할 때 발생할 수 있으므로 response.text
로 먼저 확인하세요.
9. 활용 사례
Gemini API는 다양한 분야에 활용할 수 있습니다.
- 교육: 시험 문제 풀이, 개념 요약, 맞춤형 학습 자료 생성
- 업무: 이메일 초안 작성, 보고서 요약, 코드 작성·검토
- 개인: 일상 대화, 여행 계획, 요리 레시피
- 개발: 챗봇 서비스, 데이터 분석 어시스턴트, 이미지 분석 시스템
10. 마무리
오늘은 제미나이 Gemini API 사용방법에 대해 단계별로 살펴보았습니다. 1) Google Cloud에서 API 키 발급 → 2) google-generativeai
설치 → 3) 모델 호출 → 4) 텍스트·대화·멀티모달 활용 → 5) 사용량 관리 순으로 진행하면 됩니다.
Gemini는 단순한 대화형 AI를 넘어, 텍스트와 이미지를 아우르는 멀티모달 모델로 발전했습니다. 따라서 학습, 업무, 창작 등 다양한 영역에서 큰 도움이 될 것입니다. 지금 바로 계정을 만들고 무료 크레딧으로 직접 체험해 보세요. 새로운 가능성이 열릴 것입니다.
0 Comments
댓글 쓰기