通过网络获取远程对象
1 | urlopen 用来打开并读取一个从网络获取的远程对象。因为它是一个非常通用的函数(可以轻松读取 HTML 文件、图像文件或其他任何文件流) |
BeautifulSoup
1 | BeautifulSoup 尝试化平淡为神奇。它通过定位 HTML 标签来格式化和组织复杂的网页信息,用简单易用的 Python 对象为我们展现 XML 结构信息。 |
用虚拟环境保存库文件
1 | 如果你同时负责多个 Python 项目,或者想要轻松打包某个项目及其关联的库文件,再或者你担心已安装的库之间可能有冲突,那么你可以安装一个 Python 虚拟环境来分而治之。 |
- 本文作者: 王不留行
- 本文链接: https://wyf195075595.github.io/2022/06/17/programming/python/爬虫/
- 版权声明: 本博客所有文章除特别声明外,均采用 MIT 许可协议。转载请注明出处!