본문 바로가기

claude code

Claude Code Skills - docx, pdf, pptx 스킬 활용 가이드

개요

Claude Code의 Agent Skills는 문서 작업을 자동화하는 강력한 기능입니다. Word 문서 생성부터 PDF 처리, PowerPoint 프레젠테이션 제작까지, 반복적인 문서 작업을 AI에게 맡길 수 있습니다. 이 글에서는 docx, pdf, pptx 세 가지 자동화에 활용할 수 있는 기능과 활용법을 상세히 살펴봅니다.

 

위 스킬들은 아래 anthropic에서 공유하여, 필요 시, readme를 보고 사용할 수 있습니다.

https://github.com/anthropics/skills


Agent Skills란 무엇인가

Agent Skills는 Claude의 기능을 확장하는 모듈형 역량 패키지입니다. 각 스킬은 특정 작업에 대한 전문 지식, 워크플로우, 스크립트를 담고 있어서 Claude를 범용 AI에서 전문가 수준의 에이전트로 변환시켜 줍니다.

스킬의 핵심 장점은 점진적 정보 로딩(Progressive Disclosure) 방식에 있습니다. Claude가 시작될 때 모든 스킬의 내용을 한꺼번에 불러오지 않고, 메타데이터만 가볍게 로드한 뒤 사용자의 요청에 맞는 스킬이 호출될 때 비로소 상세 지침을 불러옵니다. 이 구조 덕분에 여러 스킬을 설치해도 성능에 부담이 없습니다.

스킬은 세 단계로 정보를 로딩합니다.

  • 레벨 1 (메타데이터): 항상 로드됨. 스킬 이름과 설명만 포함하며 약 100토큰 소비
  • 레벨 2 (지침): 스킬이 트리거될 때 로드됨. SKILL.md의 본문으로 5,000토큰 이내
  • 레벨 3 (리소스): 필요할 때만 로드됨. 스크립트, 참조 문서 등 사실상 무제한

Anthropic이 제공하는 사전 빌드 스킬 중 문서 작업 관련 내용 pptx, xlsx, docx, pdf 네 가지에 대해서 작성해보려고 합니다. 해당 스킬들은 claude.ai와 Claude API에서 바로 사용할 수 있습니다. Claude Code에서는 커스텀 스킬을 파일 시스템 기반으로 생성하여 사용합니다.


docx 스킬 - Word 문서 생성 및 편집

docx 스킬은 Word 문서(.docx)의 생성, 편집, 분석을 담당합니다. .docx 파일은 본질적으로 XML 파일들을 담은 ZIP 아카이브이며, 이 구조를 활용해 정밀한 문서 조작이 가능합니다.

새 문서 생성

docx 스킬은 JavaScript의 docx 라이브러리를 사용하여 새 문서를 처음부터 만들 수 있습니다. 주요 지원 기능은 다음과 같습니다.

  • 스타일링 및 제목 체계: 제목(Heading) 레벨별 서식을 적용하고 일관된 문서 구조를 잡을 수 있습니다
  • 표(Table) 생성: 행과 열을 정의하고, 셀 너비, 배경색, 테두리 등을 세밀하게 제어합니다
  • 이미지 삽입: PNG, JPG, GIF 등 다양한 포맷의 이미지를 문서에 포함시킬 수 있습니다
  • 하이퍼링크: 외부 URL 링크와 문서 내부 북마크 링크를 모두 지원합니다
  • 각주 및 페이지 나누기: 학술 문서나 보고서에 필요한 각주와 페이지 구분을 추가합니다
  • 머리글/바닥글: 페이지 번호, 문서 제목 등을 머리글과 바닥글에 배치합니다
  • 다중 열 레이아웃: 뉴스레터나 브로슈어 스타일의 다단 레이아웃을 구성합니다
  • 목차(TOC) 생성: 제목 스타일을 기반으로 자동 목차를 생성합니다

기존 문서 편집

기존 Word 문서의 편집은 세 단계 워크플로우를 따릅니다.

  1. Unpack (해체): 문서의 XML을 추출하고 보기 좋게 정리합니다
  2. Edit XML (수정): 해체된 파일에서 필요한 XML 내용을 직접 수정합니다
  3. Pack (재조립): 수정된 내용을 다시 문서로 합치고 유효성을 검증합니다

추적 변경 및 주석

전문적인 문서 협업에 필수적인 기능들도 지원합니다.

  • 추적 변경(Track Changes): 삽입 및 삭제 태그를 활용하여 문서 수정 이력을 기록합니다. 기본 작성자는 "Claude"로 설정되며, 필요에 따라 변경할 수 있습니다
  • 주석(Comments): 문서의 특정 부분에 주석을 추가하여 피드백이나 메모를 남길 수 있습니다
  • 서식 보존: 편집 과정에서 기존 서식 블록(<w:rPr>)을 유지하여 원본 문서의 디자인을 손상시키지 않습니다

사용 예시

Claude API를 통한 Word 문서 생성 요청은 다음과 같은 형태입니다.

response = client.beta.messages.create(
    model="claude-opus-4-6",
    max_tokens=4096,
    betas=["code-execution-2025-08-25", "skills-2025-10-02"],
    container={
        "skills": [{"type": "anthropic", "skill_id": "docx", "version": "latest"}]
    },
    messages=[
        {"role": "user", "content": "재생에너지 혜택에 대한 2페이지 보고서를 작성해줘"}
    ],
    tools=[{"type": "code_execution_20250825", "name": "code_execution"}],
)

Claude Code에서는 /docx 명령으로 더 간편하게 사용할 수 있습니다.


pdf 스킬 - PDF 문서 종합 처리

pdf 스킬은 PDF 파일과 관련된 거의 모든 작업을 처리합니다. 텍스트 추출부터 문서 병합, 분할, 워터마크 추가, OCR까지 포괄적인 기능을 제공합니다.

텍스트 및 표 추출

pdfplumber를 활용한 텍스트 추출을 할 수 있고, 표(Table) 추출 후 Excel로 변환을 할 수 있습니다.

문서 병합 및 분할

여러 PDF를 하나로 합치거나, 하나의 PDF를 페이지별로 나누는 작업도 간단하게 할 수 있습니다.

워터마크 추가

문서 보안이나 브랜딩을 위해 모든 페이지에 워터마크를 적용할 수 있습니다.

암호화 및 보안

비밀번호 보호를 통해 PDF 접근을 제한할 수 있습니다.

OCR (스캔 문서 텍스트 인식)

스캔된 이미지 형태의 PDF에서 텍스트를 인식하는 OCR 기능도 지원합니다. pytesseractpdf2image를 활용하여 스캔 문서를 검색 가능한 텍스트로 변환합니다.

PDF 생성

reportlab 라이브러리를 사용하여 처음부터 새 PDF를 만들 수도 있습니다. 보고서, 인보이스, 인증서 등 다양한 형태의 PDF 문서를 프로그래밍 방식으로 생성합니다.

명령줄 도구 지원

Python 라이브러리 외에도 pdftotext, qpdf, pdftk 같은 명령줄 도구를 직접 호출할 수 있어, 대량의 PDF를 일괄 처리하는 스크립트를 작성하기에 편리합니다.


pptx 스킬 - PowerPoint 프레젠테이션 제작

pptx 스킬은 프레젠테이션의 생성과 편집을 담당합니다. 템플릿 기반 제작부터 완전히 새로운 슬라이드 구성까지, 다양한 방식으로 전문적인 프레젠테이션을 만들 수 있습니다.

핵심 기능

  • 처음부터 만들기: 자연어 프롬프트만으로 완전한 프레젠테이션을 생성합니다. 슬라이드 구조, 콘텐츠, 디자인을 AI가 자동으로 결정합니다
  • 템플릿 기반 제작: 기존 템플릿의 슬라이드 마스터, 레이아웃, 폰트, 색상 체계를 그대로 유지하면서 내용만 교체합니다
  • HTML-to-PPTX 변환: HTML 콘텐츠를 PowerPoint 형식으로 변환하는 기능을 제공합니다
  • 차트 및 다이어그램: 정적 이미지가 아닌 편집 가능한 네이티브 차트와 다이어그램을 생성합니다. 생성 후에도 PowerPoint에서 직접 수정할 수 있습니다

슬라이드 타입 자동 매핑

마크다운 문서를 프레젠테이션으로 변환할 때, 문서의 섹션을 적절한 슬라이드 타입에 자동으로 매핑합니다.

  • 제목 슬라이드: 프레젠테이션의 시작 페이지
  • 요약(Executive Summary) 슬라이드: 핵심 내용 요약
  • 본문 콘텐츠 슬라이드: 주요 설명 내용
  • 상세(Detail) 슬라이드: 데이터, 차트, 상세 분석
  • 마무리 슬라이드: 결론 및 다음 단계

QA 프로세스

pptx 스킬에는 프레젠테이션의 품질을 보장하는 검증 과정이 내장되어 있습니다.

  • 슬라이드 레이아웃의 일관성 검증
  • 폰트와 색상 체계의 통일성 확인
  • 콘텐츠가 슬라이드 영역을 넘어가지 않는지 검사
  • 차트와 이미지의 적절한 크기 및 위치 확인

사용 예시

response = client.beta.messages.create(
    model="claude-opus-4-6",
    max_tokens=4096,
    betas=["code-execution-2025-08-25", "skills-2025-10-02"],
    container={
        "skills": [{"type": "anthropic", "skill_id": "pptx", "version": "latest"}]
    },
    messages=[
        {"role": "user", "content": "재생에너지에 대한 5장짜리 프레젠테이션을 만들어줘"}
    ],
    tools=[{"type": "code_execution_20250825", "name": "code_execution"}],
)

실전 활용 팁

문서 자동화 파이프라인 구축

세 가지 스킬을 조합하면 강력한 문서 자동화 파이프라인을 만들 수 있습니다.

  • 보고서 생성 파이프라인: PDF에서 데이터 추출 → Word 보고서 작성 → PowerPoint 요약 프레젠테이션 생성
  • 문서 변환 파이프라인: Word 문서 분석 → PDF 변환 및 워터마크 추가 → 프레젠테이션 자동 생성
  • 데이터 분석 파이프라인: 여러 PDF에서 표 추출 → 데이터 통합 → Excel 보고서 및 프레젠테이션 생성

마무리

Claude Code의 docx, pdf, pptx 스킬은 문서 작업의 생산성을 획기적으로 높여줍니다. Word 보고서 생성, PDF 데이터 추출, PowerPoint 프레젠테이션 제작까지 자연어 한 문장이면 충분합니다. 특히 점진적 정보 로딩 아키텍처 덕분에 여러 스킬을 동시에 사용해도 성능 저하가 없다는 점이 큰 장점입니다. 반복적인 문서 작업에 시간을 빼앗기고 있다면, Agent Skills로 자동화를 시작해 보시기 바랍니다.


참고 자료

이 글은 Claude Code를 활용하여 작성되었습니다.