1.简单爬取百度网页内容: 8.用requests库获取源代码:爬取百度网页源代码:
import requests r=requests.get("https://www.baidu.com") r.status_code r.encoding r.encoding=r.apparent_encoding r.text
结果展示:
2.爬取网页的通用代码框架:(这里继续选用百度网页)爬取网页的通用代码框架
import requests def getHTMLText(url): try: r=requests.get(url,timeout=30) r.raise_for_status() r.encoding=r.apparent_encoding return r.text except: return "产生异常" if __name__ =="__main__": url="https://www.baidu.com" print(getHTMLText(url))
爬取结果展示
3.京东商品页面爬取京东商品页面爬取
import requests url="https://item.jd.com/2967929.html" try: r=requests.get(url) r.raise_for_status() r.encoding=r.apparent_encoding print(r.text[:1000]) except: print("爬取失败")
爬取结果展示:
4.亚马逊商品页面的爬取亚马逊商品爬取源代码
import requests url="https://www.amazon.cn/gp/product/B01M8L5Z3Y" try: kv={'user-agent':'Mozilla/5.0'} r=requests.get(url,headers=kv) r.raise_for_status() r.encoding=r.apparent_encoding print(r.text[1000:2000]) except: print("爬取失败")
结果展示:
5.百度搜索全代码百度搜索全代码
import requests keyword="Python" try: kv={'wd':'keyword'} r=requests.get("https://www.baidu.com/s",params=kv) print(r.request.url) r.raise_for_status() print(len(r.text)) except: print("爬取失败!")
结果展示:
6.360搜索全代码360搜素全代码
import requests keyword="Python" try: kv={'q':keyword} r=requests.get("https://www.so.com/s",params=kv) print(r.request.url) r.raise_for_status() print(len(r.text)) except: print("爬取失败")
结果展示:
7. 图片爬取全代码:爬取高清图片源代码
import requests import os url="https://image.nationalgeographic.com.cn/2017/0211/20170211061910157.jpg" root="D://pics//" path=root+url.split('/')[-1] try: if not os.path.exists(root): os.mkdir(root) if not os.path.exists(path): r=requests.get(url) with open(path,'wb') as f: f.write(r.content) f.close() print("文件保存成功") else: print("文件爬取失败") except: print("爬取失败")
获取源代码
import requests r=requests.get("https://python123.io/ws/demo.html") r.text demo=r.text from bs4 import BeautifulSoup soup=BeautifulSoup(demo,"html.parser") print(soup.prettify()) soup.title
爬取结果显示:
本网页所有视频内容由 imoviebox边看边下-网页视频下载, iurlBox网页地址收藏管理器 下载并得到。
ImovieBox网页视频下载器 下载地址: ImovieBox网页视频下载器-最新版本下载
本文章由: imapbox邮箱云存储,邮箱网盘,ImageBox 图片批量下载器,网页图片批量下载专家,网页图片批量下载器,获取到文章图片,imoviebox网页视频批量下载器,下载视频内容,为您提供.
阅读和此文章类似的: 全球云计算