当前位置：首页 > 网站源码 > 正文内容

java取网页源码(javaweb网站源码)

网站源码8个月前 (02-28)217

只能抓取静态的页面源代码，因为很多事件和样式是动态绑定和执行的，所以不可能获取到执行完后的代码的public String getHtmlContentString htmlurl URL urlString tempStringBuffer sb = new StringBuffertry。

好诡异试了很多次才弄好！import import import import import public class test1 public static v。

我想从这个网站抽取网页数据，主要是将该页面下部分的台风数据抽取出来，需要获取台风编号，名称，时间，地理位置等，也即是网页右下角的表格数据，之后将其存入数据库望高手指点一二最好能有完整的代码，用Java。

指定写出html的编码和html编码一致，也即指定为UTF8能获取图片可能是图片的链接是完整的URL，能获取到。

不知道你是不是要实现抓取别人的页面进行输出是的话，你可以试用下面的代码本人不会Perl，就用java的servlet实现了希望能对你有帮助 import import import impo。

试了一下正则，不是很好写暂时还没有思路现在用截取字符串的方法，实现的了想要的效果你看一下吧import import public class Test public static void mainString args。

相似网页可以用正则表达式来截取不同网站的设计，对正文部分没有一个统一的规则只能找规律，然后做一个类似通解的方法，但是误差无法避免了大概思路如下可以尝试着做一个对比的方法，找出某个标签内的文字和标签。

扫描二维码推送至手机访问。

标签: java取网页源码

分享给朋友：

返回列表

飞速云企业模版源码