본문 바로가기
반응형

Project13

[도서 입력 프로그램] 3-2. Selenium XPATH 찾기 [도서 정보 자동 입력 프로그램] 3-2. Selenium XPATH 찾기 지난 포스트로 추출한 도서 정보를 이제 본격적으로 Yes24에 등록할 시간이다.Yes24 판매관리 페이지에서 도서 정보를 등록하기 위해서는 여러가지 기본 버튼, 라디오버튼, 드롭다운 메뉴, 파일업로드(이미지 업로드)창을 클릭해야 한다.  Selenium으로 웹페이지에서 해당하는 버튼 등을 제어하려면 정확한 XPATH주소가 필요하다.잘 모를때는 크롬 개발자모드에서 XPATH주소를 그대로 복사해서 넣었는데 그러다 보니 제대로 Click이 안되는 경우가 빈번했다. 그리하여 id 등 특정 속성으로 태그를 특징하여 XPATH 주소를 넣어보니 제어가 잘 되었다. 그런데, id를 기준으로 XPATH를 작성한뒤 코드를 계속 작성하면서 테스트를 .. 2024. 5. 9.
[도서 입력 프로그램] 3-1. Selenium 입력 구조 구상 [도서 정보 자동 입력 프로그램] 3-1. Selenium 입력 구조 구상 이번 포스팅부터 본격적으로 Yes24로 도서 정보 입력을 시작한다.제일 처음으로 입력하는 구조를 구상해야 한다. 도서 정보를 알라딘에서 Yes24로 입력하는 것을 처음에는 그저 있는대로 복붙하는 굉장히 단순한 과정이라 생각했다.하지만 계속 진행을 하다보니 생각만큼 간단하지가 않았다.책의 종류가 많은 만큼 이런저런 예외적인 경우가 발생하고, 알라딘과 Yes24의 입력 방식과 분류가 달라서 그걸 끼워맞춰야할 일도 많았다. 대략적으로 아래와 같은 구분이 필요하다. 1) 가장 기본적이고 큰 문제는 바로 ISBN 유무이다.ISBN이 있는 도서라면 검색을 통해 기본정보를 불러와서 입력 절차를 간소화할 수 있다.ISBN이 없다면 모든 정보를 .. 2024. 5. 4.
[도서 입력 프로그램] 2. BeautifulSoup 알라딘 도서 정보 수집 [도서 정보 자동 입력 프로그램] 2. BeautifulSoup 알라딘 도서 정보 수집이제 알라딘에서 필요한 도서정보를 수집 해보자.Yes24 등록을 위해 수집해야하는 정보는 아래와 같다.도서정보판매가격상품 상태(상/중/하)도서 구분(국내도서/외국도서/음반/DVD)도서 대표이미지(이미지 주소로 추출)도서 주제분류(중분류/소분류)저자명출판사명출판일자ISBN (없는 도서도 있음)책 주의사항(html 태그로 수집)책 사진(이미지 주소로 수집)이렇게 12가지이다. 이외에 서점별로 책 분류 및 색인을 위해 표기하는 자체 상품코드도 있는데 알라딘 판매자 로그인 자동화가 불가하므로 그것은 다른 방법을 통해 입력하도록 하겠다. 도서 페이지에서 이제 정보를 추출하기 위해서 파이썬 BeautifulSoup4 과 reque.. 2024. 5. 3.
[도서 입력 프로그램] 1. Selenium 자동 로그인 (feat. 소스코드 민감정보 보안) [도서 정보 자동 입력 프로그램] 1. Seleinium 자동 로그인자동화가 필요한 대략적인 작업 구조는 이러하다.1. 알라딘 판매자 로그인2. Yes24로 입력할 도서 정보(ISBN, 도서명, 가격, 상태 등) 추출3. Yes24 판매자 로그인4. 도서 정보 입력 후 등록 우선 1번과 3번에서 필요한 자동 로그인 기능부터 구현해보자.파이썬으로 웹페이지 자동 로그인을 하기 위해서는 주로 Selenium 라이브러리를 사용한다. 나 같은 초짜일 수록 코딩의 9할은 결국 복붙인것 같다.Chat GPT가 활성화된 요즘엔 특히 더욱 그러하다.구글링 또는 Chat GPT로 쉽게 Selenium 자동 로그인 코드를 검색해서 아래와 같이 적용해보았다.from selenium import webdriverfrom sel.. 2024. 4. 30.
반응형