我有一个工作bash脚本提取的标题标签。 我需要给AWK域分隔从HTML提取meta标签,这样的帮助:
<meta name="keywords" content="key1, key2, key3">
我的脚本工作,提取标题,但meta name
不起作用。
#!/bin/bash
for LINE in `cat htmls.txt`
do
echo $LINE
awk 'BEGIN{IGNORECASE=1;FS="<title>|</title>";RS=EOF} {print $2}' $LINE |
awk '{ if (NF > 0) printf("%s\n", $0); }'
done
我想我需要一个正则表达式的解决方案。 有任何想法吗?