반응형

안녕하세요, 왕초보 코린이를 위한 코딩유치원에 오신 것을 환영합니다.

 

코딩유치원에서는 파이썬 기초부터 사무자동화, 웹크롤링, 데이터 분석 등의 다양한 패키지까지 초보자도 알기 쉽도록 내용을 정리해 놓았습니다.

 

업무는 물론 투자에도 도움이 될만한 전자공시시스템(DART)나 텔레그램(Telegram) 관련 패키지도 배울 수 있으니 많은 관심 부탁드립니다.

 

 

<Python-docx 관련 글>

 

2021.12.27 - [파이썬 패키지/Word] - [Python-docx] 파이썬으로 MS워드 문서 다루기 1편. 문서 생성, 저장, 불러오기, 글자 입력

2021.12.28 - [파이썬 패키지/Word] - [Python-docx] 파이썬으로 MS워드 문서 다루기 2편. 이미지 삽입, 표 삽입

2021.12.30 - [파이썬 패키지/Word] - [Python-docx] 파이썬으로 MS워드 문서 다루기 3편. 기존 양식의 내용 읽는 법 (ft. 문단, 표 인덱싱)


 

오늘은 지난 시간에 배웠던 Pywin32 패키지의 win32com 모듈이 아닌, python-docx 라이브러리를 이용해서 word 파일을 다루어 보겠습니다.

 

 

1. 패키지 설치

 

아래의 코드를 터미널 창 혹은 주피터 노트북의 셀(cell)에 입력하고 실행시켜주세요. 참고로 해당 패키지는 Windows OS 뿐만 아니라 Mac OS에서도 잘 작동합니다.

pip install python-docx

 

2. 패키지 불러오기

 

python-docx 라이브러리에는 다양한 클래스들이 존재하며, 원하는 기능(스타일, 정렬, 표 등등)에 따라서 import 해주는 것이 조금씩 다릅니다.

 

아래는 몇가지 예로 든 것 외에도 많은 것들이 있으며, 오늘은 Document 클래스를 이용한 기능들만 알아보겠습니다.

# 가장 기본적인 기능(문서 열기, 저장, 글자 쓰기 등등)
from docx import Document

# 문단 정렬
from docx.enum.text import WD_ALIGN_PARAGRAPH

# 문자 스타일 변경
from docx.enum.style import WD_STYLE_TYPE

 

3. 새 워드문서 만들기

 

위에서 import를 했다면 문서 객체(Object)를 만들어 줄 차례입니다. 참고로 객체란 클래스(Class)를 변수로 선언해줌으로써 만들 수 있습니다.

 

doc = Document()

 

 

4. 워드문서 저장하기

 

현재는 그냥 새 워드문서가 파이썬 상에서만 존재하는 상태입니다. 이것을 우리가 사용하는 실제 워드 파일로 만들어주고 싶으면 아래의 코드로 객체를 저장해주어야합니다.

 

# 현재 작업경로에 저장
doc.save('저장하고 싶은 파일명.docx')

 

저장하실 때 특정 위치에 저장하고 싶으시면, 절대경로를 입력해주시면 됩니다.

 

저장된 docx 파일

 

5. 저장된 워드문서 불러오기

 

만약 기존의 워드파일을 불러오고 싶으시다면 아래와 같이 코딩해주시면 됩니다.

여기서 '저장하고 싶은 파일명'은 위에서 저장했던 파일명을 그대로 사용한 것입니다.

# 절대경로를 이용하는 방법
doc = Document(r'C:\Users\SANGWOO\Desktop\VSCODE\저장하고 싶은 파일명.docx')

# 현재작업 경로에 '파일명.docx'가 위치할 때
doc = Document('저장하고 싶은 파일명.docx')

불러온 파일 (실제 출력되지는 않음)

 

6. 워드문서에 글자 입력하기

 

워드의 가장 기본적인 기능인 글자를 입력하는 방법을 알아보겠습니다.

 

1) 제목 넣기

위와 같이 제목을 넣는 방법은 아래의 코드를 사용합니다. 코드와 이미지를 보면서 비교해보세요.

 

# 제목
doc.add_heading('가장 큰 제목 (아래에 밑줄)', level=0)
doc.add_heading('제목 크기, H1', level=1)
doc.add_heading('제목 크기, H2', level=2)
doc.add_heading('제목 크기, H3', level=3)
doc.add_heading('제목 크기, H4', level=4)
doc.add_heading('제목 크기, H5', level=5)
doc.add_heading('제목 크기, H6', level=6)

 

level이 어디까지 가능한지 확인은 해보지 않았으며, 레벨 3 밑으로는 글자 크기가 더 작아지지 않는 것으로 보입니다.

 

2) 문단(paragraph) 넣기

 

여기서 말하는 문단이란 그냥 한줄로 쭉 이어지는 글을 말합니다. 즉, 엔터를 치지 않은 상태의 글을 의미합니다.

참고로 제목도 하나의 문단이라고 할 수 있습니다.

 

doc.add_paragraph('여기에 원하는 텍스트를 마음껏 입력하면 됩니다.')

 

 

3) 문단에 문자 추가하기

 

문단에 글자를 쭉 이어서 쓸 수도 있지만 특정한 문자를 강조하고 싶거나 다른 스타일을 주고 싶을 때는 add_run( ) 함수를 사용합니다.

 

우선 위에서와 같이 add_paragraph( ) 함수를 사용하되 변수에 담아줍니다.

p = doc.add_paragraph('두번째 문단: 여기에 원하는 텍스트를 마음껏 입력하면 됩니다.')

 

변수 p에 .add_run( ) 함수로 글자를 추가해줍니다. 스타일 적용 방법은 아래의 코드를 참고하세요.

# 굵은 글씨(Bold) 적용
p.add_run('문단에 굵은 글자 추가').bold = True

# 기울임꼴(Italic) 적용
p.add_run('문단에 기울인 글자 추가').italic = True

# 밑줄(Underline) 적용
p.add_run('문단에 밑줄 글자 추가').underline = True

 

여기서 강조하고 싶은 것은 add_run( )은 반드시 paragraph 객체를 기반으로 사용할 수 있다는 점입니다.
 
오늘 준비한 내용은 여기까지입니다. 다음 시간에는 문서에 그림과 표를 넣는 방법을 자세히 다루어보겠습니다.
 

 

<참고 문서>

 

1. python-docx 공식 문서

https://python-docx.readthedocs.io/en/latest/index.html

 

반응형

+ Recent posts