中文
Sign in
AI tools
热门问题
时间线
聊天
Loading AI tools
全部
文章
字典
引用
地图
Data scraping
来自维基百科,自由的百科全书
Found in articles
Scrapy
2015]. (原始内容存档于2020-10-31). Bell, Eddie; Heusser, Jonathan. Scalable
Scraping
Using Machine Learning. [28 July 2015]. (原始内容存档于2016-10-09). Scrapy |
网页抓取
网页抓取(英語:web
scraping
)是一种从网页上获取页面内容的计算机软件技术。通常透過软件使用低级别的超文本传输协议模仿人类的正常访问。 网页抓取和网页索引极其相似,其中网页索引指的是大多数搜索引擎采用使用的机器人或网络爬虫等技术。与此相反,网页抓取更侧重于转换网络上非结构化数据(常见的是H
一亩三分地新型冠状病毒肺炎疫情实时动态
Chaowei Phil. COVID-Scraper: An Open-Source Toolset for Automatically
Scraping
and Processing Global Multi-Scale Spatiotemporal COVID-19 Records. IEEE
安娜的檔案
交媒體推薦人使用安娜的檔案,並表示「我們的數據和代碼都是開源的,因此可以無限地東山再起」。 2023年10月,安娜的檔案称已抓取(英语:
Data
scraping
)了世界上最大的图书元数据数据库(聯合目錄)WorldCat的數據,去重后共7亿条记录,以助其实现保存世界上所有书籍的目标。2024年1
文献管理软件比较
engines)。在某些情况下,可以直接在参考资料管理器中进行搜索和检索。在其他情况下,小书签或Firefox扩展程序将允许对网站进行抓取(英语:
Data
_
scraping
#Screen_
scraping
)。 有些参考管理器提供网络功能(N/A,不可用,表示产品没有网络功能,而“否”表示产品有网络功能,但缺乏已实施的功能)