在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
开源软件名称:hemin1003/java-spider开源软件地址:https://github.com/hemin1003/java-spider开源编程语言:Java 85.4%开源软件介绍:JAVA爬虫框架实战基于webmagic框架二次开发的java爬虫框架实战,已实现能爬取腾讯,搜狐,今日头条(单独集成功能,教程学习地址)等资讯内容,配合elasticsearch框架用法,实现了自动爬虫,已投入生产试用中。 体验系统地址:http://182.92.82.188:8280/manage/login.jsp 体验账号/密码,test1001/a12345678 后台系统源码:https://github.com/hemin1003/aylson-parent 关于我欢迎交流问题,可加我的个人QQ 469580884,或群号 751925591,一起探讨交流问题 感谢
欢迎使用 Gather Platform 数据采集与分析平台详细使用方法请参考 在线文档 Gather Platform 数据抓取平台是一套基于Webmagic内核的,具有Web任务配置和任务管理界面的数据采集与搜索平台.具有以下功能
5分钟即可部署完毕,半分钟即可完成一个爬虫,开始数据采集.、 不需要进行任何编码就可以完成一个功能强大的爬虫. Windows/Mac/Linux 全平台支持本系统需要如下依赖:
可选依赖组件: - Elasticsearch 5.0 在线文档部署、使用方法、二次开发手册、常见问题等全部迁移至 |
2023-10-27
2022-08-15
2022-08-17
2022-09-23
2022-08-13
请发表评论