Study/Python

[파이썬] selenium 크롬 드라이버(chromedriver) 자동 설치 방법

셀레니움을 활용해 크롤링을 할 때 필수적으로 브라우저에 맞는 웹 드라이버를 별도로 설치해야 하는데, 설치된 크롬 브라우저에 맞는 드라이버를 자동으로 설치해주는 chromedriver_autoinstaller 패키지가 있어 소개드리고자 합니다. 이 패키지를 활용하면 chromedriver 버전 관리에 신경 쓰지 않아도 되며 다른 사람에게 배포 파일을 공유할 때에도 각 실행환경의 크롬 브라우저 버전이 달라서 생기는 스트레스를 해소할 수 있을 것 같습니다. (여기서 파생되어 다른 개발자분이 엣지 브라우저에 맞게 제작한 edgedriver-autoinstaller 패키지도 있으나 MacOS에서는 올바르게 동작하지 않아 수정이 필요해 보였습니다.) 패키지 설치 pip install selenium pip inst..

2021.02.19 게시됨

 포스팅 썸네일 이미지

Study/Python

[파이썬] 티스토리 API - 카테고리 목록 가져오기

티스토리 API를 이용해 글을 작성하거나 수정하기 위해서는 카테고리 번호를 파라미터로 입력해야 하기 때문에 오늘은 블로그에 존재하는 카테고리 목록을 가져오는 도전을 해보았습니다. 앞서 포스트 목록을 가져오는 단계에서 많은 삽질을 한 덕분에 꽤 수월하게 처리할 수 있었습니다. 시작에 앞서 어김없이 티스토리에서 제공하는 '오픈 API 가이드'를 확인하여 보았습니다. 처음엔 API 가이드가 아주 불친절하다고 생각했는데 이제는 위의 주소에 아래의 파라미터 값을 적절하게 넣어서 호출하면 되겠구나.. 하는 어렴풋한 개념이 자리 잡아가고 있습니다. 역시 서투른 목수가 연장 탓을 한다고... 다만, 응답 item이 5개라고 설명하고 있으나 실제로는 6개의 item이 응답되고 있습니다. import requests ap..

2021.02.16 게시됨

 포스팅 썸네일 이미지

Study/Python

[파이썬] 티스토리 API - 전체 포스트 목록 가져오기

오늘은 티스토리 API를 활용해보는 첫 단계로 블로그에 존재하는 전체 포스트 목록을 가져오는 코드를 짜보았습니다. 도전 우선 티스토리에서 제공하는 '오픈 API 가이드'를 확인하여 보았습니다.(며칠 동안) output에 대해서는 설명이 없어 당황했는데 json, xml 두 가지의 형태로 출력이 가능한 것으로 보였습니다. (default는 xml) . json()을 활용하면 dict 형식으로 변환되기 때문에 output을 json 형태로 지정하였습니다. import requests, re, math import pandas as pd from tabulate import tabulate appid = "" access_token = "" callback_url = "" blogName = ">" def l..

2021.02.15 게시됨

 포스팅 썸네일 이미지

Study/Python

[파이썬] 티스토리 API - 신청 및 Access Token 발급

티스토리에서 제공하는 API를 이용하면 블로그에 직접 접속하지 않고도 포스트 내용을 조회하거나 글을 작성하고 수정할 수 있습니다. 그러기 위한 기본 단계로 오픈 API를 신청하고 Access Token을 발급받는 과정을 알아보도록 하겠습니다. 앱 등록(오픈 API 신청) 아래 링크를 클릭해 신청 페이지로 이동합니다. https://www.tistory.com/guide/api/manage/register TISTORY 나를 표현하는 블로그를 만들어보세요. www.tistory.com 그리고 아래 사진을 참고하여 내용을 입력하고 등록하면 API를 이용할 수 있는 권한을 얻을 수 있습니다. 테스트 용도라면 URL과 CallBack URI는 블로그 주소 정도로 작성해 주시면 되며, 별도로 프로그램이나 웹서비스..

2021.02.13 게시됨

 포스팅 썸네일 이미지

Study/Python

사이트맵에서 페이지 목록 파싱해보기

블로그를 시작하다 보니 온통 관심사가 블로그로 쏠리게 되었습니다. 구글과 네이버에 사이트 등록을 하면서 sitemap.xml의 존재에 대해 알게 되었고, 확인해보니 사이트 내의 페이지 목록과 최종 수정 일자가 표기되어 있는 것을 알게 되었습니다. 그래서 이 내용을 파싱 하여 페이지 리스트를 얻고 각 페이지에 접속해 alt 속성 누락 여부를 확인할 수 있을까? 여기에 추가해 최종 수정 일자를 대조하여 수시로 점검이 가능할까? 하는 궁금증이 생겼고 sitemap.xml 파싱에 도전하게 되었습니다. 실패기 막연한 생각에 .xml 확장자니 'ElementTree'를 활용하면 되지 않을까 하는 생각이 들었고 다음과 같이 코드를 짜보았으나 제대로 되지 않았습니다. 그나마 가장 근접했다고 생각하는 코드는 이렇습니다...

2021.02.13 게시됨

 포스팅 썸네일 이미지

Study/Python

티스토리 포스팅 alt 속성 입력 프로그램

| 다운로드 ※ 분할압축으로 전체 파일을 다운로드하시면 됩니다! | 설명 미흡한 실력으로 혹시 모를 오류가 존재할 수 있으니 사용 시 주의 부탁드립니다. 포스트 작성 시 사진 파일에 작성한 "이미지 설명"을 alt 속성으로 입력하는 프로그램입니다. | 사용방법 1. 티스토리 에디터에서 1차 포스트 작성 - 작성 시 이미지 파일에 설명 작성하기 2. 티스토리 에디터 'html 모드'로 전환 및 본문 내용 복사 3. 프로그램에 html 전문 붙여넣기 4. 프로그램에서 'Alt 속성 생성' 버튼 클릭 5. 티스토리 에디터에 붙여 넣고'기본모드'로 전환하여 오류 여부 확인 6. 게시물 발행 | 화면 및 기능 안내 메뉴 설명 Alt 속성이 이미 존재할 경우? - '변경 안 함' 선택 시 기존의 Alt 속성을 그대..

2021.02.08 게시됨

 포스팅 썸네일 이미지

Study/Python

사업자등록상태 조회 프로그램 (휴/폐업, 간이/일반 여부)

다운로드 - 코딩 초보가 제작한 것으로 다소 느리거나 오류가 발생할 수 있습니다. - 프로그램에 문제가 있다면 바로 삭제하겠습니다. 동기 이전 회사에서 거래처가 휴업 또는 폐업 처리한 상황인지 여부와 간이과세와 일반과세 여부를 주기적으로 확인하는 업무가 있었습니다. 일부 ERP 프로그램에서 사업자 조회가 가능한 경우가 있는 것으로 알고 있지만 아쉽게도 제가 근무하는 환경에서는 그렇지 않았습니다. 그럴 때마다 홈택스 조회 화면에서 사업자번호를 입력해야 했는데, 단 건은 상관없지만 수백 개의 사업자번호를 모두 조회하는 것은 대단한 근성이 필요했습니다. 그래서 사업자등록상태를 대량으로 조회할 수 있는 프로그램을 제작해 보았습니다. 제작 웹 사이트를 다루는 방법은 잘 몰라서 인터넷을 찾아보며 끙끙댔는데 위의 링..

2021.02.06 게시됨

닫기 아이콘
사이드 프로필 배경이미지
아바타 이미지

Taedi's Log

#태디 #코딩린이

자습한 내용을 기록하는 공간이라 다소 먼 길로 돌아가는 방법들이 존재할 수 있습니다🐹 Python, Web에 관심을 갖기 시작했습니다🐶