Data scraping - Wikiwand

Scrapy

2015]. （原始内容存档于2020-10-31）. Bell, Eddie; Heusser, Jonathan. Scalable Scraping Using Machine Learning. [28 July 2015]. （原始内容存档于2016-10-09）. Scrapy |

网页抓取

网页抓取（英語：web scraping）是一种从网页上获取页面内容的计算机软件技术。通常透過软件使用低级别的超文本传输协议模仿人类的正常访问。网页抓取和网页索引极其相似，其中网页索引指的是大多数搜索引擎采用使用的机器人或网络爬虫等技术。与此相反，网页抓取更侧重于转换网络上非结构化数据（常见的是H

一亩三分地新型冠状病毒肺炎疫情实时动态

Chaowei Phil. COVID-Scraper: An Open-Source Toolset for Automatically Scraping and Processing Global Multi-Scale Spatiotemporal COVID-19 Records. IEEE

安娜的檔案

交媒體推薦人使用安娜的檔案，並表示「我們的數據和代碼都是開源的，因此可以無限地東山再起」。 2023年10月，安娜的檔案称已抓取（英语：Data scraping）了世界上最大的图书元数据数据库（聯合目錄）WorldCat的數據，去重后共7亿条记录，以助其实现保存世界上所有书籍的目标。2024年1

文献管理软件比较

engines）。在某些情况下，可以直接在参考资料管理器中进行搜索和检索。在其他情况下，小书签或Firefox扩展程序将允许对网站进行抓取（英语：Data_scraping#Screen_scraping）。有些参考管理器提供网络功能（N/A，不可用，表示产品没有网络功能，而“否”表示产品有网络功能，但缺乏已实施的功能）