Jsoup官网地址:http://jsoup.org/
一:最新的maven 版本
<!-- https://mvnrepository.com/artifact/org.jsoup/jsoup -->
<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.13.1</version>
</dependency>
1. 通过ID解析单个input元素
Document doc = Jsoup.parse( responseStr );
Element inputTag = doc.getElementById("dataVal");
String dataVal = inputTag.attr("value");
2. 解析单个input元素
String html = "<p><input align=\"top\" src=\"/项目名/userfiles/image/yiyiren.jpg\" width=\"60%\" type=\"image\" longdesc=\"undefined\" /></p>";
Document doc = Jsoup.parse(html);
Element inputTag = doc.select("input").first();
String value= inputTag.attr("value");
3. 解析多个input元素
String html = "<p><input src=\"/项目名/userfiles/image/QQ图片20130618085610.jpg\" width=\"200\" height=\"99\" type=\"image\" longdesc=\"undefined\" /><strong>名称</strong>:薏苡仁<br /><input align=\"top\" src=\"/项目名/userfiles/image/yiyiren.jpg\" width=\"60%\" type=\"image\" longdesc=\"undefined\" /><br /></p>";
Document doc = Jsoup.parse(html);
Elements elements = doc.select("input");
for(Element inputTag : elements){
String imgUrl = inputTag.attr("src");
System.out.println("imgUrl=====" + imgUrl);
}
4. 直接通过URL、处理HTML
Document doc = Jsoup.connect("http://www.baidu.com").get();
Element inputTag = doc.getElementById("dataVal");
String dataVal = inputTag.attr("value");
String text = doc.body().text(); // 取得body的文本
Element link = doc.select("a").first();//查找第一个a元素
String linkText = link.text(); // 取得链接地址中的文本
String href = link.attr("href"); // 取得链接地址
String linkOuterH = link.outerHtml();
String linkInnerH = link.html(); // 取得链接内的html内容
5. 通过Class选择器
Document doc = Jsoup.parse( responseStr );
//获取目标HTML代码
Elements elements4 = doc.select("[class=wea]");
String text = elements4.get(0).text();
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/160846.html