如何提取网页的meta标签上的Android?(How to extract meta tags f

2019-09-30 05:53发布

有读元标记针对Android的URL的内容一个聪明的办法? 我将展示在Android上的网页视图一个网页,并想读取里面的元标记一些信息。 是解析网页的字符串,找到特殊字符串“META NAME =” X -...的唯一途径” CONTENT =‘!’或有任何更聪明的方式?

Answer 1:

一个聪明的方式将使用杰里科库

假设你有一个这样的HTML文件

<html xmlns="http://www.w3.org/1999/xhtml" debug="true">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=Windows-1252"/>
<link href="styleUrgente.css" rel="stylesheet" type="text/css"/>
<meta name="viewport" content="width = 320, initial-scale = 1.0, user-scalable = no"/>
<meta name="joc-height" value="120"/>
<meta name="joc-enabled" value="1"/>
</head>
<body margin="0" marginheight="0" marginwidth="0" topmargin="0" leftmargin="0" rightmargin="0" bottommargin="0">
<script src="chrome-extension://bmagokdooijbeehmkpknfglimnifench/googleChrome.js"/>
</html>

例如获得meta标签的名称为“价值joc-height ”,你可以用这个方法:

public String extractAllText(String htmlText){
        Source source = new Source(htmlText);   
        String strData = "";        
        List<Element> elements = source.getAllElements("meta");

        for(Element element : elements )
        {
            final String id = element.getAttributeValue("name"); // Get Attribute 'id'
             if( id != null && id.equals("joc-height")){
                 strData = element.getAttributeValue("value").toString();    
                   }
        }
        return strData;
    }

你会得到的“价值120



文章来源: How to extract meta tags from website on android?