加入收藏 | 设为首页 | 会员中心 | 我要投稿 安卓应用网 (https://www.0791zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Java > 正文

java – 跟踪对网页内容的更改

发布时间:2020-05-24 23:00:20 所属栏目:Java 来源:互联网
导读:我需要跟踪网站内容的变化:我的用户有一个他们想要监控的网站列表,并在这些网站的内容更新时收到提醒.我知道有一些工具可以做到这一点:firefox插件,如check 4更改,更新扫描仪等.但是,我需要从我的应用程序执行此操作并将我的应用程序中受监控网站的任何更新

我需要跟踪网站内容的变化:我的用户有一个他们想要监控的网站列表,并在这些网站的内容更新时收到提醒.我知道有一些工具可以做到这一点:firefox插件,如check 4更改,更新扫描仪等.但是,我需要从我的应用程序执行此操作并将我的应用程序中受监控网站的任何更新报告给我用户.我怎么能用 javascript或java做到这一点?

解决方法

您可能想要的是一个Web爬虫,它在每个页面上运行快速diff或hash来检查更改.这是关于 Java Web爬虫库的问题: https://stackoverflow.com/questions/2495289/what-is-a-good-java-web-crawler-library

至于散列,MD5非常快,并且保证为不同的内容提供不同的散列(即使它只是略有不同). CRC甚至更快,但不太可靠.

如果这些都不适合你,希望搜索“{Java | Javascript}网络爬虫”会给你一些想法.

(编辑:安卓应用网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读