对于必应的抓取,小幻目前已知的有三种,手机版,必应的XML文档+JSON,还有像我这样的直接首页抓取
手机版的抓取出来会有必应的水印,我就不介绍了。一下主要介绍一下首页抓取和XML中抓取
XML/JOSN的内容都是必应的一个接口,用哪个都是可以的,就不多说了。
XML和json的抓取很简单。
XML的抓取正则preg_match("/<url>(.+?)<\/url>/ies", $str, $matches)
如果是JSON就更简单了,直接从JSON中接收就好了
再说说直接首页的抓取吧,一样是正则抓取
首页抓取正则preg_match_all("/g_img={url:'(.*)'/U",$d,$img)
然后,后面你要干什么自己想吧!
额,忘了说几个被抓取得页面了
首页抓取,就直接打开首页即 cn.bing.com
XML文档地址 http://cn.bing.com/HPImageArchive.aspx?idx=0&n=1
JSON地址 http://cn.bing.com/HPImageArchive.aspx?format=js&idx=0&n=1
好了,就这么写,不过速度我真不知道哪个好,自己看着办吧,反正我用着首页的,不过我是保存到数据库。不用每次都抓取,每次打开都重新抓取一遍,感觉不太友好!
学习了
2016年10月29日 10:27你好。你的那个必应图片跳转到原图的源代码可以分享吗?
2015年6月7日 11:23这个和需分享了,其实就是个header跳转而已~
2015年6月7日 19:24还有,我已经直接把他切到本地了,必应会在3个月删除图片的
if ($img) {
2015年6月7日 19:30header(“location:$img”);
} else {
exit(‘error’);
}
就这样了,$img变量即为你file_get的地址
header(‘Content-Type: image/JPEG’);
@ob_end_clean();
@readfile($imgl);
@flush();
@ob_flush();
exit();
或者这样输出图片,也是那个变量
没水印就是1366x768bing.xiao201261.ml
2015年3月21日 15:23额,很多接口……我说的手机版的是获取别的东西……尺寸也是可以修改的
2015年3月21日 18:02做dz论坛空间加上话认为很消耗资源然后就停令人
2015年3月22日 09:51你不会跳转……
2015年3月22日 10:00图片里面用php水印加hitokoto.us文字这不消耗资源么
2015年3月22日 10:09哎,谁说一定要水印的,json获取后,css定到图片上不就好了,这一切都是用户的事
2015年3月22日 10:12=,= 我说的是dz空间 只能用csshttp://i.pcbeta.com/space-uid-2867428.html
2015年3月22日 11:05必应很少人在用
2015年3月18日 13:54他的图片不错
2015年3月18日 18:20我就在用π_π
2015年3月29日 15:02主题很不错
2015年3月29日 15:21