한컴테크를 통해 한컴의 기술을 공유합니다. 한컴의 프로그래밍, 프레임워크, 라이브러리 및 도구 등 다양한 기술을 만나보세요. 한컴 개발자들의 다양한 지식을 회사라는 울타리를 넘어 여러분과 공유합니다. 한컴이 제공하는 기술블로그에서 새로운 아이디어와 도전을 마주하고, 개발자가 꿈꾸는 미래를 실현하세요.

한컴테크

python

한/글 문서 파일 형식: Python을 통한 HWP 포맷 파싱하기 (2)

이 글은 Python을 이용해 HWP 파일의 본문을 파싱하는 과정을 설명합니다. Section 스트림을 zlib으로 해제해 문단 단위 레코드를 읽고, 텍스트·제어 문자·글자 모양(CharShape)·문단 모양(ParaShape)을 파싱하는 절차를 코드와 함께 다룹니다. 또한 샘플 파일을 분석해 글꼴·색상·정렬 같은 서식이 실제 렌더링과 일치함을 확인했습니다. 이번 글은 본문 파싱까지를 정리하며, 다음 글에서는 표와 그림 등 복잡한 컨트롤 객체 파싱 방법을 이어서 다룰 예정입니다.

한/글 문서 파일 형식: Python을 통한 HWPX 포맷 파싱하기 (2)

이 글은 HWPX 문서의 본문 데이터 추출 과정을 설명합니다. 문서 구조(본문–구역–문단)와 section.xml·header.xml 간 참조 방식을 소개하고, run 요소에서 텍스트·표·그림 등 콘텐츠를 어떻게 파싱하는지 다룹니다. Python 코드 예제를 통해 데이터 모델 설계, 본문 XML 파일 구조와 추출 데이터 모델, 데이터 추출 과정을 보여주며, 실제 샘플 문서로 서식 정보가 본문에 적용되는 방식을 확인합니다.

Python의 시작, 그리고 개발 환경 세팅과 관리

시작하며… 이번 글에서는 파이썬 언어를 사용하여, 개발하고 동료 개발자들과의 협업할 때 유용한 도구들을 소개하려 합니다. 해당 글은 주니어 개발자 및 타 프로그래밍 언어는 익숙하지만 파이썬 언어는 많이 다뤄보지 않은 분들에게 초점을 맞춰서 작성되었다는 점 참고 부탁드립니다. 왜 파이썬인가? 파이썬 언어의 가장 큰 특징으로는 위 문구에서 보다시피, 직관적이고 문법이 단순하여 아름다우며 생산성이 매우 빠릅니다. 이런 특징을 …

Python의 시작, 그리고 개발 환경 세팅과 관리 더 보기 »

Scroll to Top