상식닷컴
로그인
가입하기
2026년 상식닷컴 선정 식당 & 카페 리스트
2025년 2026년 신상 호텔 리스트
최근에 오픈한 호텔을 찾는다면 살펴보세요
일주일 식단표 어플
자동 일주일 식단표 어플
안드로이드
아이폰
주식 & 코인 차트의 신
1000만원으로 2000만원 만들기 프로젝트
수정하기 - 셀레니움에서 페이지의 모든 링크를 가져오는 방법은?
닉네임
비밀번호
제목
내용
[이미지 업로드는 권한이 있는 사람만 가능. 하단 카톡으로 연락]
셀레니움(Selenium)은 웹 애플리케이션을 자동화하는 데 사용되는 강력한 도구입니다. 웹 페이지의 모든 링크를 가져오는 것은 웹 스크래핑이나 테스트 자동화에서 자주 필요한 작업 중 하나입니다. 아래에서는 셀레니움을 사용하여 페이지의 모든 링크를 가져오는 방법에 대해 자세히 설명하겠습니다. 1. 셀레니움 설치 먼저, 셀레니움을 사용하기 위해 필요한 라이브러리를 설치해야 합니다. Python을 사용하는 경우, pip를 통해 셀레니움을 설치할 수 있습니다. ```bash pip install selenium ``` 또한, 웹 브라우저를 자동화하기 위해 해당 브라우저의 드라이버도 필요합니다. 예를 들어, Chrome 브라우저를 사용할 경우 ChromeDriver를 다운로드하여 설치해야 합니다. 2. 기본 코드 구조 셀레니움을 사용하여 웹 페이지의 모든 링크를 가져오는 기본적인 코드 구조는 다음과 같습니다. ```python from selenium import webdriver from selenium.webdriver.common.by import By 웹 드라이버 경로 설정 driver_path = 'path/to/chromedriver' ChromeDriver의 경로 driver = webdriver.Chrome(driver_path) 원하는 웹 페이지 열기 url = 'https://example.com' 링크를 가져올 웹 페이지 URL driver.get(url) 모든 링크 가져오기 links = driver.find_<a href='https://sangseek.com/sangseeks/element/ko'>element</a>s(By.TAG_NAME, 'a') 링크 출력 for link in links: print(link.get_attribute('href')) <a href='https://sangseek.com/sangseeks/드라이버 종료/ko'>드라이버 종료</a> driver.quit() ``` 3. 코드 설명 - 웹 드라이버 설정 : `webdriver.Chrome(driver_path)`를 사용하여 Chrome 브라우저를 실행합니다. `driver_path`는 ChromeDriver의 경로를 지정합니다. - 웹 페이지 열기 : `driver.get(url)`을 통해 원하는 웹 페이지를 엽니다. - 링크 가져오기 : `driver.find_elements(By.TAG_NAME, 'a')`를 사용하여 페이지 내의 모든 `<a>` 태그(링크)를 찾습니다. 이 메서드는 해당 태그를 가진 모든 요소를 리스트 형태로 반환합니다. - 링크 출력 : 반복문을 통해 각 링크의 `href` 속성을 출력합니다. `link.get_attribute('href')`를 사용하여 링크의 URL을 가져옵니다. - 드라이버 종료 : 모든 작업이 끝난 후 `driver.quit()`을 호출하여 브라우저를 종료합니다. 4. 추가 고려사항 - 동적 페이지 : 만약 페이지가 JavaScript를 통해 동적으로 로드되는 경우, `<a href='https://sangseek.com/sangseeks/WebDriverWait/ko'>WebDriverWait</a>`을 사용하여 특정 요소가 로드될 때까지 대기할 수 있습니다. ```python from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC 특정 요소가 로드될 때까지 대기 WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.TAG_NAME, 'a'))) ``` - 중복 링크 제거 : 가져온 링크 중 중복된 링크를 제거하고 싶다면, `set`을 사용하여 중복을 제거할 수 있습니다. ```python unique_links = set(link.get_attribute('href') for link in links) for link in unique_links: print(link) ``` - 링크 필터링 : 특정 조건에 맞는 링크만 가져오고 싶다면, 조건문을 추가하여 필터링할 수 있습니다. 5. 결론 셀레니움을 사용하여 웹 페이지의 모든 링크를 가져오는 것은 간단한 작업입니다. 위의 예제 코드를 기반으로 필요에 따라 추가적인 기능을 구현할 수 있습니다. 웹 스크래핑을 할 때는 항상 해당 웹사이트의 이용 약관을 준수하고, 과도한 요청을 피하는 것이 중요합니다.
이용안내
커뮤니티 이용안내
×
- 게시한 게시글로 발생하는 문제는 게시자에게 책임이 있습니다.
- 게시글이 타인/타업체의 저작권을 침해할 경우 모든 책임은 게시자에게 있습니다. 게시자가 모든 손해를 부담해야 합니다.
- 상식닷컴 운영자는 게시자와 상의하지 않고 게시글을 수정 또는 삭제할 수 있습니다.
- 상식닷컴 운영자는 깨끗한 커뮤니티 공간을 만드는 것이 1순위입니다.
수정하기
취소하기