jsoup是一个非常好用的html解析工具。使用时需要下载相应的jar包。
成都创新互联公司是一家集网站建设,平潭企业网站建设,平潭品牌网站建设,网站定制,平潭网站建设报价,网络营销,网络优化,
平潭网站推广为一体的创新建站企业,帮助传统企业提升企业形象加强企业竞争力。可充分满足这一群体相比中小企业更为丰富、高端、多元的互联网需求。同时我们时刻保持专业、时尚、前沿,时刻以成就客户成长自我,坚持不断学习、思考、沉淀、净化自己,让我们为更多的企业打造出实用型网站。
下面就是我使用jsoup解析html的表格的java源代码。
亲测可用!
public void parse(){
String htmlStr = "
"
+ " "
+ ""
+ " 这里是要获取的数据1 "
+ "这里是要获取的数据2 "
+ " | "
+ ""
+ " 这里是要获取的数据3 "
+ "这里是要获取的数据4 "
+ " | "
+ "
"
+ "
";
Document doc = Jsoup.parse(htmlStr);
// 根据id获取table
Element table = doc.getElementById("kbtable");
// 使用选择器选择该table内所有的
|
Elements trs = table.select("tr");
//遍历该表格内的所有的
|
for (int i = 0; i < trs.size(); ++i) {
// 获取一个tr
Element tr = trs.get(i);
// 获取该行的所有td节点
Elements tds = tr.select("td");
// 选择某一个td节点
for (int j = 0; j < tds.size(); ++j) {
Element td = tds.get(j);
// 获取td节点的所有div
Elements divs = td.select("div");
// 选择一个div
for (int k = 0; k < divs.size(); k++) {
Element div = divs.get(k);
//获取文本信息
String text = div.text();
//输出到控制台
System.out.println(text);
}
}
}
}
网站名称:使用jsoup解析html的table中的文本信息实例-创新互联
URL地址:
http://cdweb.net/article/dchohh.html