한컴테크를 통해 한컴의 기술을 공유합니다. 한컴의 프로그래밍, 프레임워크, 라이브러리 및 도구 등 다양한 기술을 만나보세요. 한컴 개발자들의 다양한 지식을 회사라는 울타리를 넘어 여러분과 공유합니다. 한컴이 제공하는 기술블로그에서 새로운 아이디어와 도전을 마주하고, 개발자가 꿈꾸는 미래를 실현하세요.

한컴테크

Author name: 김규리

한/글 문서 파일 형식: Python을 통한 HWPX 포맷 파싱하기 (1)

이 글은 HWPX 문서 포맷의 내부 구조를 “한/글 문서 파일 형식 : HWPX 포맷 구조 살펴보기”와 KS X 6101 표준 문서를 바탕으로 이해하고, 이를 통해 문서의 일부 데이터를 추출하여 Python 객체(Document)로 구조화하는 과정을 실제 문서와 예제 코드를 통해 살펴봅니다. ZIP 기반 XML 파일에서 메타정보, 커서 위치, 폰트 정보, 바이너리 데이터 목록 등을 추출하는 방법을 상세히 설명하며, HWPX 문서 내부 구조 분석의 기초를 제공합니다.

한/글 문서 파일 형식 : HWPX 포맷 구조 살펴보기

이 글은 개방형 문서 포맷인 HWPX의 구조와 데이터를 저장하고 관리하는 방식을 다룹니다. HWPX와 기존 HWP 포맷의 차이를 설명하며, HWPX 포맷의 주요 구성 요소와 각 파일의 역할을 분석합니다. HWPX 문서 데이터를 활용하기 위한 기초 지식을 제공하는 글입니다.

Scroll to Top