首页 >> 知识科普

吉利申请网页数据爬取方法专利,提升网页数据的清洗效率和精度

2026-01-13 知识科普 3 作者:zk520

国家知识产权局信息显示,浙江吉利控股集团有限公司、吉利汽车研究院(宁波)有限公司申请一项名为“一种网页数据的爬取方法、装置、电子设备及介质”的专利,公开号CN121301637A,申请日期为2025年9月。

专利摘要显示,本申请公开了一种网页数据的爬取方法、装置、电子设备及介质,该方法包括:解析用户输入的数据爬取请求,得到解析结果;基于数据爬取请求进行数据爬取,得到待清洗网页数据;根据解析结果,确定数据清洗策略库中,是否存在可用于清洗待清洗网页数据的目标清洗策略;若存在,通过目标清洗策略,对待清洗网页数据进行清洗,得到目标爬取数据;若不存在,根据待清洗网页数据,基于目标大模型生成目标清洗策略,并执行通过目标清洗策略,对待清洗网页数据进行清洗,得到目标爬取数据的步骤。由此,通过目标大模型的介入,自动生成清洗策略,提升策略生成效率和准确性,避免依赖人工维护清洗策略导致的高成本,进而提升网页数据的清洗效率和精度。

天眼查资料显示,浙江吉利控股集团有限公司,成立于2003年,位于杭州市,是一家以从事汽车制造业为主的企业。企业注册资本103000万人民币。通过天眼查大数据分析,浙江吉利控股集团有限公司共对外投资了38家企业,参与招投标项目523次,财产线索方面有商标信息5000条,专利信息5000条,此外企业还拥有行政许可275个。

吉利汽车研究院(宁波)有限公司,成立于2016年,位于宁波市,是一家以从事专用设备制造业为主的企业。企业注册资本3000万人民币。通过天眼查大数据分析,吉利汽车研究院(宁波)有限公司共对外投资了8家企业,参与招投标项目317次,专利信息5000条,此外企业还拥有行政许可19个。

声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

来源:市场资讯

tags:

关于我们

最火推荐

小编推荐

联系我们


Copyright 梦网.Some Rights Reserved.