Study/Python
사이트맵에서 페이지 목록 파싱해보기
블로그를 시작하다 보니 온통 관심사가 블로그로 쏠리게 되었습니다. 구글과 네이버에 사이트 등록을 하면서 sitemap.xml의 존재에 대해 알게 되었고, 확인해보니 사이트 내의 페이지 목록과 최종 수정 일자가 표기되어 있는 것을 알게 되었습니다. 그래서 이 내용을 파싱 하여 페이지 리스트를 얻고 각 페이지에 접속해 alt 속성 누락 여부를 확인할 수 있을까? 여기에 추가해 최종 수정 일자를 대조하여 수시로 점검이 가능할까? 하는 궁금증이 생겼고 sitemap.xml 파싱에 도전하게 되었습니다. 실패기 막연한 생각에 .xml 확장자니 'ElementTree'를 활용하면 되지 않을까 하는 생각이 들었고 다음과 같이 코드를 짜보았으나 제대로 되지 않았습니다. 그나마 가장 근접했다고 생각하는 코드는 이렇습니다...