Python爬取百度旅游网站的景点

来源：互联网发布：php云人才系统采集编辑：程序博客网时间：2024/06/02 15:22

from selenium import webdriverimport csvimport timelink='https://lvyou.baidu.com/yuanmingyuan?&request_id=3137216805&lowflow=1&innerfr_pg=sceneListPg&accur_thirdpar=destination&idx=6'# driver = webdriver.Chrome()# driver = webdriver.Firefox(executable_path=r"D:\FireFox\firefox.exe")driver = webdriver.Firefox()driver.get(link)header = ['id','pinglun']with open('pinglun.csv','wb') as datacsv:    csvwriter = csv.writer(datacsv,dialect=("excel"))    csvwriter.writerow(header)xiayiye = driver.find_element_by_class_name("tangram-pager-next").textwhile xiayiye:    for i in range(1,7):        pinglun = driver.find_element_by_xpath('//*[@id="remark-container"]/div[3]/div['+str(i)+']/div[2]/div[2]/div[1]').text        data = [i,pinglun.encode('utf-8')]        with open("pinglun.csv", "a") as datacsv:            csvwriter = csv.writer(datacsv, dialect=("excel"))            csvwriter.writerow(data)        print(i)    print('click')    driver.find_element_by_class_name("tangram-pager-next").click()    time.sleep(2)

0 0