ISBN/价格: | 978-7-03-060637-2:CNY142.00 |
作品语种: | chi |
出版国别: | CN 110000 |
题名责任者项: | 基于Python的Web大数据爬取实战指南/.夏换, 杨秀璋, 于小民编著 |
出版发行项: | 北京:,科学出版社:,2019 |
载体形态项: | 275页:;+图:;+24cm |
丛编项: | 大数据科学研究丛书 |
一般附注: | 贵州省普通高等学校科技拔尖人才支持计划项目“定向钻机远程实时监控大数据分析评价系统”(黔教合KY字 [2016] 068) 贵州省教育厅青年科技人才成长项目“实体和属性对齐方法的研究与实现”(黔教合KY字 [2016] 172) 贵州省教育厅青年科技人才成长项目“无线校园网络建设中Mesh网关负载均衡问题研究”(黔教合KY字 [2016] 178) 资助贵州省科技计划项目重点项目“圆形地下连续墙结构时变性仿真研究”(黔科合基础 [2019] 1403号) 贵州省科技计划项目“多源地理数据融合知识图谱构建方法在舆情分析中的应用-以 贵州省为例”(黔科合基础 [2019] 1041号) |
提要文摘: | 本书主要是基于Python的Web大数据爬取实战指南, 选题内容包括基础知识和通过Python爬取Web网页数据两大部分。下图是PythonWeb数据采集的结构图, 主要包括三个部分: 网络传播技术、信息提取技术和数据存储技术。网络传播通常是使用HTTP进行, 常用的传播方式包括HTML、XML、Json、Ajax和纯文本等; 信息提取技术主要可以通过Python语言、R语言、Java语言等进行获取, 其中主要包括的技术包括: 正则表达式、XPath技术、Selenium、BeautifulSoup等; 数据存储技术主要是存储爬取的数据信息, 主要包括SQL数据库、纯文本格式等。 |
题名主题: | 软件工具 程序设计 |
中图分类: | TP311.561 |
个人名称等同: | 夏换 编著 |
---|
个人名称等同: | 杨秀璋 编著 |
---|
个人名称等同: | 于小民 编著 |
记录来源: | CN 湖北三新 20190418 |