当前位置:首页 > 新闻动态 > 网站文章

分享一段源码挖掘IMDb电影信息

来源: 浏览:129 时间:2023-08-08
#!/bin/bash
#Date 2019-09-17
PATH=/bin:/sbin:/usr/sbin:/usr/local/bin:/usr/local/sbin:~/bin
export PATH
titleurl="http://www.imdb.com/title/tt"
imdburl="http://www.imdb.com/find?s=tt&exact=true&ref_=fn_tt_ex&q="
tempout="/tmp/moviedata.$$"
summarize_film()
{
 grep "" $tempout | sed 's/<[^>]*>//g;s/(more)//'
 grep --color=never -A2 '<h5>Plot:' $tempout | tail -1 |
 cut -d -f1 | fmt | sed 's/^/ /'
 exit 0
}
trap "rm -f $tempout" 0 1 15
if [ $# -eq 0 ] ; then
 echo "Usage:$0 {movie title | movie ID}" >&2
 exit 1
fi
######
nodigits="$(echo $1 | sed 's/[[:digit:]]*//g')"
if [ $# -eq 1 -a -z "$nodigits" ] ;then
 lynx -source "$titleurl$1/combined" > $tempout
 summarize_film
 exit 0
fi
########
fixedname="$(echo $@ | tr ' ' '+')"
url="$imdburl$fixedname"
lynx -source $imdburl$fixedname > $tempout
fail="$(grep --color --color=never '<h1 class="findHeader">No ' $tempout)"
if [ ! -z "$fail" ] ;then
 echo "Failed:no results foun for $1"
 exit 1
elif [ ! -z "$(grep '<h1 class="findHeader">Displaying' $tempout)" ] ;then
 grep --color=never '/title/tt' $tempout | 
 sed 's/</
 </g' | 
 grep -vE '(.png|.jpg|>[ ]*$)' |
 grep -A 1 "a href=" | 
 grep -v '^--$' | 
 sed 's/<a href="/title/tt//g;s/</a>//' | 
 awk '(NR %2 ==1){title=$0} (NR %2 ==0){print title " " $0}' | 
 sed 's//.*>/: /'|
 sort
fi
exit 0
</pre><p>| 
 sed 's/<a href="/title/tt//g;s/</a>//' | 
 awk '(NR %2 ==1){title=$0} (NR %2 ==0){print title " " $0}' | 
 sed 's//.*>/: /'|
 sort
fi
exit 0</p><p>大家可以复制下来运行一下,不懂的话直接私信小编,或者加群讨论!!一起学习一起进步!!!</p><p>我们是做教育的,希望大家能够学到知识,这个一直是我们的初衷!!</p><p>记住噢,加群讨论噢,不懂的可以问,也有人回答的。</p>	
			</div>
            <div class="pagIng">
                <a href="/anyouwz/8301.html">从python入门开始抓取你想要的电影,一周可掌握基础,附完整源码</a>  
				<a href="/anyouwz/8303.html">百度熊掌号对seo的优化有那些好处?</a></div>
        </div>
    </div>
</div>

<script type="text/javascript">
$(function(){
    $(".zSubnav li").hover(function(){
        $(this).stop().animate({top:"-10"},300)
    },function(){
        $(this).stop().animate({top:"0"},300)
    })
});
$('.fonts a').click(function (){
    $('.fonts a').removeClass('active');
    $(this).addClass('active');
    switch( $(this).index() ){
        case 0:
            $('.detailCont').css({fontSize:14});
            return false;
        case 1:
            $('.detailCont').css({fontSize:15});
            return false;
        case 2:
            $('.detailCont').css({fontSize:16});
            return false;
    }
});
</script>

<!-- 底部 -->

<div class="zFooter">

    <div class="wrap1200 clearfix">

        <div class="cont fl">

            <h3>地址 · <span>ADDRESS</span></h3>

            <p>地址:建邺区新城科技园嘉陵江东街18号2层</p>

            <p>邮箱:309474043@qq.Com</p>

            <a class="fukuan tr" href="/anyoucase/">点击查看更多案例</a>

        </div>

        <div class="tel fl">

            <h3>联系 · <span>CALL TEL</span></h3>

            <p class="p1">400-8793-956</p>

            <p class="p2">售后专线:025-65016872</p>

            <p>业务QQ:309474043    售后QQ:1850555641</p>

        </div>

        <div class="code fr"><img src="/img/wx.jpg"></div>

        <div class="clearfix"></div>

        <div class="box" style="line-height: 25px;">

            <div class="hot fl" style="width: 40%;height: auto;">

               <a href="http://www.anyouy.cn/" title="南京网站建设">南京网站建设</a><em>|</em><a href="http://www.anyouy.cn/" title="南京小程序开发">南京小程序开发</a><em>|</em><a href="http://www.anyouy.cn/" title="南京网站开发">南京网站开发</a>
            </div>

            <div> <p class="copy">©南京安优网络科技有限公司  版权所有    <a href="https://beian.miit.gov.cn" target="_blank">苏ICP备12071769号-4</a>  <a href="/sitemap">网站地图</a></p>
            </div>

        </div>                    
        <div class="clearfix"></div>

        <div class="links">

            <span>友情链接:</span>

            <em>|</em>  
<a href="http://www.ayxcx.cn/" title="南京小程序开发">南京小程序开发</a> |

        </div>
    </div>

</div>


<script src="/img/wow.min.js"></script>

<script>$(function(){new WOW().init();})</script>

<script type="text/javascript">

//导航

$(window).scroll(function(){

    if($(window).scrollTop()>=100){

        $(".zHeader").addClass("on");


    }else{

        $(".zHeader").removeClass("on");

    }

})

//签约

jQuery(".zSigning").slide({titCell:".hd ul",mainCell:".bd ul",autoPage:true,effect:"leftLoop",autoPlay:true,vis:4,scroll:4});

//访问统计

window.onload = function() {

    $.ajax({url:"/Api/Hitstall/index",});

}

</script>

<div class="tqfloat">
    <ul>
        <li class="hidden style1"><a class="tit" target="_blank" href="http://wpa.qq.com/msgrd?v=3&uin=309474043&site=qq&menu=yes">业务咨询</a></li>
        <li class="hidden style1"><a class="tit" target="_blank" href="http://wpa.qq.com/msgrd?v=3&uin=309474043&site=qq&menu=yes">技术支持</a></li>
        <li class="hidden style2"><p>联系电话</p><div class="tel">4008-793-956</div></li>
        <li class="hidden style1"><a class="tit" target="_blank" href="http://wpa.qq.com/msgrd?v=3&uin=309474043&site=qq&menu=yes">投诉留言</a></li>
        <li class="hidden gotop"><a class="tit" href="javascript:;"></a></li>
    </ul>
</div>
<script type="text/javascript">
$(function(){
    $(".tqfloat li.style2").hover(function(){
        var _this = $(this);
        _this.removeClass("hidden").stop().animate({left : - 184}, 400)
    }, function(){
        var _this = $(this);
        _this.stop().animate({left : 0}, 400, function(){
            _this.addClass("hidden")
        })
    })
    $(".tqfloat li.style1").hover(function(){
        $(this).removeClass("hidden").stop().animate({marginLeft : - 10}, 400)
    }, function(){
        var _this = $(this);
        _this.stop().animate({marginLeft : 0}, 400, function(){
            _this.addClass("hidden")
        })
    })
    $(".gotop").click(function(){
        $("html,body").stop().animate({scrollTop: "0"},600)
    })

    $(".subnav li").hover(function(){
        $(this).stop().animate({top:"-10"},300)
    },function(){
        $(this).stop().animate({top:"0"},300)
    })
});
</script>
<script>
var _hmt = _hmt || [];
(function() {
  var hm = document.createElement("script");
  hm.src = "https://hm.baidu.com/hm.js?1c94697d8167ffaf76dd51252f3ad1a7";
  var s = document.getElementsByTagName("script")[0]; 
  s.parentNode.insertBefore(hm, s);
})();
</script>
<div class="jszx" style="display:none">
  <div class="jxin"><img src="/img/xt_bg.jpg" alt="" /></div>
  <div class="jszxdd">
    <h1>零风险合作体验</h1>
    <p>侧重以结果为服务导向,不满意退还所有费用,最大限度降低客户的合作风险<br>安优网络从不青睐于向客户虚夸我们的能力<br>如果量身定制的作品让您满意我们相信合作的基础会更加夯实。</p>
    <p><a href="tel:400-8793-956">400-8793-956</a></p>
    <span><a href="http://wpa.qq.com/msgrd?v=3&uin=309474043&site=qq&menu=yes" target="_blank">在线咨询</a></span><span><a href="javascript:vido(0)" class="jszx1">稍后再说</a></span> </div>
</div>

<script language="javascript">
setTimeout(function (){$(".jszx").show()},3000)//表示1000毫秒后执行第一次显示层
$(function(){
$(".jszx3,.jszx1").click(function(){
$(".jszx").hide();//点击关闭层
//每3000毫秒执行一次显示当前层
$(this).stop().fadeTo(955000, 1, function(){
$(".jszx").show();
});
});

});
</script>
</body>
</html>