상식닷컴
로그인
가입하기
2026년 상식닷컴 선정 식당 & 카페 리스트
2025년 2026년 신상 호텔 리스트
최근에 오픈한 호텔을 찾는다면 살펴보세요
일주일 식단표 어플
자동 일주일 식단표 어플
안드로이드
아이폰
주식 & 코인 차트의 신
1000만원으로 2000만원 만들기 프로젝트
수정하기 - 셀레니움에서 웹 페이지의 HTML 소스를 가져오는 방법은?
닉네임
비밀번호
제목
내용
[이미지 업로드는 권한이 있는 사람만 가능. 하단 카톡으로 연락]
셀레니움(Selenium)은 웹 <a href='https://sangseek.com/sangseeks/애플/ko'>애플</a>리케이션을 자동화하는 데 사용되는 강력한 도구로, 웹 페이지의 HTML 소스를 가져오는 데도 유용합니다. 셀레니움을 사용하면 브라우저를 자동으로 제어하여 웹 페이지를 로드하고, 그 페이지의 HTML 소스를 쉽게 추출할 수 있습니다. 아래에서는 셀레니움을 사용하여 웹 페이지의 HTML 소스를 가져오는 방법을 단계별로 설명하겠습니다. 1. 셀레니움 설치 먼저, 셀레니움을 사용하기 위해 Python 환경에 셀레니움을 설치해야 합니다. 다음 명령어를 사용하여 설치할 수 있습니다. ```bash pip install selenium ``` 또한, 웹 드라이버(예: <a href='https://sangseek.com/sangseeks/ChromeDriver/ko'>ChromeDriver</a>, GeckoDriver 등)를 다운로드하여 시스템 경로에 추가해야 합니다. 여기서는 Chrome을 예로 들겠습니다. 2. 웹 드라이버 설정 웹 드라이버를 설정하고 브라우저를 실행하는 코드를 작성합니다. 아래는 Chrome 브라우저를 사용하는 예제입니다. ```python from selenium import webdriver Chrome 드라이버 경로 설정 driver_path = 'path/to/chromedriver' ChromeDriver의 경로를 입력하세요. driver = webdriver.Chrome(executable_path=driver_path) 웹 페이지 열기 url = 'https://example.com' 가져오고자 하는 웹 페이지의 URL driver.get(url) ``` 3. HTML 소스 <a href='https://sangseek.com/sangseeks/가져오기/ko'>가져오기</a> 웹 페이지가 로드된 후, `page_source` 속성을 사용하여 HTML 소스를 가져올 수 있습니다. 아래는 HTML 소스를 가져오는 코드입니다. ```python HTML 소스 가져오기 html_source = driver.page_source HTML 소스 출력 print(html_source) ``` 4. 웹 페이지 작업 후 종료 작업이 끝난 후에는 브라우저를 종료해야 합니다. 이를 위해 `quit()` 메서드를 사용합니다. ```python 브라우저 종료 driver.quit() ``` 전체 코드 예제 위의 모든 단계를 통합한 전체 코드 예제는 다음과 같습니다. ```python from selenium import webdriver Chrome 드라이버 경로 설정 driver_path = 'path/to/chromedriver' ChromeDriver의 경로를 입력하세요. driver = webdriver.Chrome(executable_path=driver_path) try: 웹 페이지 열기 url = 'https://example.com' 가져오고자 하는 웹 페이지의 URL driver.get(url) HTML 소스 가져오기 html_source = driver.page_source HTML 소스 출력 print(html_source) finally: 브라우저 종료 driver.quit() ``` 추가 팁 1. 대기 시간 설정 : 웹 페이지가 완전히 로드될 때까지 기다리기 위해 `WebDriverWait`을 사용할 수 있습니다. 이는 동적 콘텐츠가 있는 페이지에서 유용합니다. 2. JavaScript 렌더링 : 셀레니움은 JavaScript로 동적으로 생성된 콘텐츠도 가져올 수 있습니다. 따라서 AJAX 요청으로 로드되는 데이터도 쉽게 추출할 수 있습니다. 3. <a href='https://sangseek.com/sangseeks/HTML 파싱/ko'>HTML 파싱</a> : 가져온 HTML 소스를 BeautifulSoup와 같은 라이브러리를 사용하여 파싱하고 원하는 데이터를 추출할 수 있습니다. 4. 헤드리스 모드 : 브라우저를 GUI 없이 실행하고 싶다면, Chrome의 경우 `options`를 설정하여 헤드리스 모드로 실행할 수 있습니다. ```python from selenium.webdriver.chrome.options import Options options = Options() options.headless = True 헤드리스 모드 설정 driver = webdriver.Chrome(executable_path=driver_path, options=options) ``` 이와 같은 방법으로 셀레니움을 사용하여 웹 페이지의 HTML 소스를 쉽게 가져올 수 있습니다.
이용안내
커뮤니티 이용안내
×
- 게시한 게시글로 발생하는 문제는 게시자에게 책임이 있습니다.
- 게시글이 타인/타업체의 저작권을 침해할 경우 모든 책임은 게시자에게 있습니다. 게시자가 모든 손해를 부담해야 합니다.
- 상식닷컴 운영자는 게시자와 상의하지 않고 게시글을 수정 또는 삭제할 수 있습니다.
- 상식닷컴 운영자는 깨끗한 커뮤니티 공간을 만드는 것이 1순위입니다.
수정하기
취소하기