重写/掩码文章内外部链接(rewrite/mask external link inside art

2019-10-17 18:07发布

我想重写/屏蔽所有外部URL在我的文章,并添加nofollowtarget="_blank" 。 这样,原先链接到外部网站是获取加密/屏蔽/重写。

例如:

original link: www.google.com
rewrite it to: www.mydomain.com?goto=google.com

不存在用于重写外部链接的Joomla插件: 改写插件 。

但我不使用Joomla。 请看看上面的插件,这不正是我所期待的。

我想要的是?

$article = "hello this is example article I want to replace all external link http://google.com";
$host = substr($_SERVER['HTTP_HOST'], 0, 4) == 'www.' ? substr($_SERVER['HTTP_HOST'], 0) : $_SERVER['HTTP_HOST'];

if (thisIsNotMyWebsite){
    replace external url

}

Answer 1:

您可以使用DOM文档解析和遍历文档。

function rewriteExternal($html) {

        // The url for your redirection script
        $prefix = 'http://www.example.com?goto=';

        // a regular expression to determine if
        // this link is within your site, edit for your
        // domain or other needs
        $is_internal = '/(?:^\/|^\.\.\/)|example\.com/';

    $dom = new DOMDocument();

    // Parse the HTML into a DOM
    $dom->loadHTML($html);

    $links = $dom->getElementsByTagName('a');

    foreach ($links as $link) {
            $href = $link->getAttribute('href');
            if (!preg_match($is_internal, $href)) {
                $link->getAttributeNode('href')->value = $prefix . $href;
                $link->setAttributeNode(new DOMAttr('rel', 'nofollow'));
                $link->setAttributeNode(new DOMAttr('target', '_blank'));
            }
    }

    // returns the updated HTML or false if there was an error
    return $dom->saveHTML();
}

这种方法会比使用正则表达式基础的解决方案,因为它实际上解析DOM为你而不是依靠往往脆弱的正则表达式更可靠。



Answer 2:

就像是:

<?php
 $html ='1224 <a href="http://www.google.com">google</a> 567';
$tracking_string = 'http://example.com/track.php?url=';
$html = preg_replace('#(<a[^>]+href=")(http|https)([^>" ]+)("?[^>]*>)#is','\\1'.$tracking_string.'\\2\\3\\4',$html);
echo $html; 

在这里的行动: http://codepad.viper-7.com/7BYkoc

- 我的最后一次更新

<?php
$html =' 1224 <a href="http://www.google.com">google</a> 567';

$tracking_string = 'http://example.com/track.php?url=';
$html = preg_replace('#(<a[^>]+)(href=")(http|https)([^>" ]+)("?[^>]*>)#is','\\1 nofollow  target="_blank" \\2'.$tracking_string.'\\3\\4\\5',$html);

echo $html;

http://codepad.viper-7.com/JP8sUk



文章来源: rewrite/mask external link inside article