美国东部时间3月1日,雅虎公司联合创始人之一的杨致远将宣布公司的搜索网络将进入Web服务。雅虎公司在www.developer.yahoo.com网站建立了Yahoo Search Developer Network,公司计划在此纽约举行的搜索引擎战略大会(Search Engine Strategies Conference)上推出这一计划。该网络将允许开发者在雅虎搜索之上建立新的应用程序,其中包括图像、视频、新闻以及地区搜索等内容。想要使用这项服务的会员必须先去http://api.search.yahoo.com/webservices/register_application 申请一个自已的ID号,注:每个ID号每天只能搜索5000次。
下面我们看一下,如何用javascript脚本调用Yahoo! Search API实现搜索的效果,全部脚本如下:
...
“自动转向”技术一:什么是自动转向技术(Auto-Redirecting)?自动转向,也叫自动重定向。自动跳转,指当访问用户登陆到某网站时,自动将用户转向其它网页地址的一种技术。转向的网页地址可以是网站内的其它网页,也可以是其它网站。通常情况下,浏览器会收到一个网页,该页面含有自动加载一其它网页的代码。该页面有可能在服务器端被转换,这样的话,浏览器只收到一个页面,而自动转向往往意味着浏览器收到的页面具有自动将访问用户送至其它页面的功能。对自动转向技术的合理应用包括:将用户转向到指定浏览器的网页版本;当网站的域名变更或删除后将人们转向到新域名下,等等。但现在这种技术却往往被搜索引擎优化人士用来作为提高网站的搜索引...
function String_html($url) //fopen方式获取url对应的html代码,返回没有过滤html的正文
{
$OutString = "";
$fp = fopen($url,"r");
while(!feof($fp))
{
$OutString .= fgets($fp);
}
fclose($fp);
return $OutString;
}
function match_google($url) {
$html = googleHTML("www.google.cn", $url);
preg_match_all( "/<b>([0-9,]+)</b>/" ,$html, $res);
//print_r($res[0]);
//print_r($res[1]);
return $res[1][0];
}
//由于Google对php的自动抓取函数fopen不响应,所以采用socket的方式请求数据
function googleHTML($host, $url) {
$httph...
美国东部时间3月1日,雅虎公司联合创始人之一的杨致远将宣布公司的搜索网络将进入Web服务。雅虎公司在www.developer.yahoo.com网站建立了Yahoo Search Developer Network,公司计划在此纽约举行的搜索引擎战略大会(Search Engine Strategies Conference)上推出这一计划。该网络将允许开发者在雅虎搜索之上建立新的应用程序,其中包括图像、视频、新闻以及地区搜索等内容。想要使用这项服务的会员必须先去http://api.search.yahoo.com/webservices/register_application 申请一个自已的ID号,注:每个ID号每天只能搜索5000次。
下面我们看一下,如何用PHP脚本调用Yahoo! Search API实现搜索的效果...
FTP 搜索引擎 FTP搜索引擎的功能是搜集匿名FTP服务器提供的目录列表以及向用户提供文件信息的查询服务。由于FTP搜索引擎专门针对各种文件,因而相对WWW搜索引擎,寻找软件、图像、电影和音乐等文件时,使用FTP搜索引擎更加便捷。国外著名的FTP搜索引擎 http://www.philes.com 号称全球最大的FTP搜索引擎。http://www.alltheweb.com fastsearch.com的产品。http://www.filesearching.com Chertovy Kulichki Inc.的产品。http://www.souborak.com internauci.pl的产品。http://www.ftpfind.com www.echo.fr的产品 。http://parker.vslib.cz 作者是Technical University of Liberec Czech Republic的Jiri A. Ran...
类别:其它 -
协议大全 查看:146
更新:2014-05-09
搜索引擎收录页面实际上就是在互联网上进行数据采集,这是搜索引擎最基础的工作,而搜索引擎的内容都来自后台的庞大的URL列表,通过这些URL,不断的收录,储存及维护,而学习搜索引擎收录的流程,收录原理及收录方式,有效的提高搜索引擎对网站的收录的数量。1. 页面收录流程,在互联网中,URL是每个页面的入口地址,”蜘蛛程序”通过这些URL列表抓取到页面的,“蜘蛛”不断的从这些页面中获取URL资源及存储页面,并加入URL列表,如此不断的循环,搜索引擎就可以从互联网中获取到足够的页面。URL是页面的入口,则域名则是网站的入口,搜索引擎就是通过域名进入网站,挖掘URL资源,换而言之搜索引擎在...
很多人在群里聊到一些事情,比如原创是如何被搜索引擎确定的?今天分享一下自己对搜索引擎确定原创内容的看法。 首先我们明确两个概念:原创与伪原创 原创:简单地理解就是第一次在网络上发表的内容。 伪原创:就是对原创进行的第二次或者第N次经过修改的转载发表。比如修改标题,增加摘要,转载不完整内容等等。 搜索引擎对于原创的判断是如何进行的呢? 一般来讲有以下几个方面的因素决定: 1、快照日期。 2、蜘蛛抓取日期。 3、页面外链的多少。 4、文章修改的程度。 举例:如果一篇标题为《搜索引擎如何确定你的就是原创内容》的文章在今天10点第一次发表在一个博客或者网站上。会有什么结果呢? 搜索引擎蜘蛛来到这个博客或者网站,发现这个页...
面向机器的抓取优化1 缺省域名唯一化:缺省goalercn.com 设置301跳转到 www.goalercn.com 一方面减少搜索引擎页面消重的负担,一方面可以将针对相同内容的反向链接权重汇总。对于缺省使用https访问的网站,如果不跳转(比如以前的支付宝),往往还会有浏览器提示安全证书路径不匹配的问题; 另外: 在Google Webmaster tools中也有缺省域名的配置;2 被遗忘的流量:想办法搜集域名解析失败和拼写错误导致的流量流失;曾经启用过的域名,就尽量不要删除,一直保留并设置转向到最新的地址;有渠道取到DNS的这种记录吗?3 404页面的运营:返回hard 404(返回http header而不是html 404 header),统计并跟踪带有referer的404日志,修正这些问题;...
每个网站在建立和完善的时候,都在偏向于搜索引擎的嗜好,这是在流量为王的互联网时代不可避免的,毕竟百度、google等搜索引擎是流量入口。那如何优 化你的网站,让你的网站从百度、google等搜索引擎分走更多的流量呢?从以下8个步骤做起,绝对能找到针对搜索引擎的最佳方式:1、内容在注册网址之前就应该先搜集至少一百页的内容,这些内容必须是有价值的、不违反著作权的内容。每天建立一个500~1000字的网页,当然这个网页里面必须包含你重要的关键字,如果想不出关键字来的话,可以使用Yahoo的关键字建议工具。每天都要生产一个有内容的页面。长期来说,当然是有主题的文章比较有效,尽量减少个人文章、过短的文章等等,并且请注意你的...
随着“眼球经济”席卷互联网,成千上万的资金迅速流向最能吸引浏览着眼球的搜索引擎市场。有大量调查显示搜索引擎市场正处在高速发展时期,成为了未来几年内最具发展潜力的产业之一。随着Google、百度、中国搜索等各具特色的搜索引擎逐渐成为人们最常用的网络工具,企业对搜索引擎的注意力也从“观察”升级为“动武”。随着市场容量和使用者人数的不断激增,如何完善搜索功能使之更加公平、公开、标准和人性化也就随之成为了一个备受关注的话题。但是有一个矛盾体在这其中不断的显现出来:收费可以为搜索引擎公司带来利润,但同时会降低访问者的体验满意度。如何权衡金钱和用户需求之间的天平呢?Google成功的秘...
SEO是网络营销中的一种手段,是一种企业的信息战略,对于seo而言并不能起到决定性的作用,对于网络营销而言seo起的是辅助性作用,作为网络营销人员必须要对其有个正确的认识,seo讲究的思维和技术的结合。作用是有限的,我们作为seo的倡导者必须慢慢的控制,现在社会上出现了不少的黑帽和网络骗子使得seo在一定的层度上遭到了负面的影响,这对于他们而言可能是会使得他们得到了很多的利润。但是在服务的同时使得企业对seo丧失了信心,那么seo就不要再谈什么发展再谈什么市场了。所以对于seo的发展是有害而无利的。对于seo而言搜索引擎的相关问题是一个很尖锐的问题,对于 seo和竞价是一对矛盾体,很大的层度上他们在形成了很大的竞争,但...
实在受不了一些站长和设计人员在制作网站时犯的低级错误了。这些低级错误总是在很多网站上重复出现,今天总结一下,给那么不知道问题所在、没有头绪、一片茫然、痛苦不堪的站长和公司提个醒。下面的几个毛病请不要再犯。人类的发展史就是一部不断解决重复性错误的斗争史,不断和愚蠢较量的斗争史,不断积累有用方法的斗争史,不断清理失效方法的斗争史,也就是一个 适应变化的改变过程。世界上很多问题其实都有现成的答案,这些问题频繁出现,新上手的站长需要去学习,需要导师去指点,才不会走弯路。不要相信什么自己摸 索比直接学习得到的知识更有价值。有些东西你永远想不透,有些时间你耗不起,有些代价你不必付出。站在巨人的肩膀上借...
SEO的中文意思是搜索引擎优化。通过总结搜索引擎的排名规律,对网站进行合理优化,使你的网站在百度和Google的排名提高,让搜索引擎给你带来客户。 1、永远不要放过网页的title,这个地方应该是你每次优化的重点。 2、请不要在title,description,keyword里写太多东西,越是贪婪,得到的就越少。 3、网页的头部和底部是很重要,对于搜索引擎来说,尽量将关键字加到里面。 4、关键字需要认真选择,不要选太宽,太宽你做不赢门户,也不要选太窄,太窄就算做到第一了,也没多少流量。 5、做SEO至少要有点东西护体,就算你做垃圾站,至少在视觉上像个正规站,不要一进去就内衣,性用品广告满天飞,就算不被K,用户也会鄙视你。 6、不要...
对于每一个站长而言,最关键的某过于搜索引擎能够正常收录,一旦网站不能正常收录一切都是痴心妄想。为什么会出现收录困难?这是因为搜索引擎机器人是一个很简单的软件程序,它本身对站点并没有任何的理解能力,只是通过一些固有的标准来评判站点的好坏,一旦站点在写法上出现了错误,搜索引擎将无法对站点进行采集。 6个常见的导致收录困难的原因 原因一:网站在没有建设好的情况下就上线了(如死链很多) 这个很容易被忽视的,在您的网站上线之前,哪怕去掉那些没用的死链,也不能因为”好看“而保留着。 原因二:站点的robots.txt文件已损坏或者在书写的时候出现错误(例如出现错别字) 如果搜索引擎机器人错误的理解...
用户体验,英文名称:User Experience,缩写便为UE或者UX。广泛的讲是一种纯主观的在用户使用一个产品或者某种服务的过程中建立起来的切身感受。因为它是纯主观角度的,就难免会带有一定的不确定因素。因每个人的观点不同也决定了每个用户的真实体验是无法通过其他途径来衡量相比的。但是对于一个主观相似的用户群体来讲,其用户体验的共同性是能够由良好的设计以及包装能够达到。站在网站的角度来讲则是是指用户访问一个网站或者使用一个系统时的全部体验感受。他们对网站的印象和切身感觉,是否成功?是否享受?是否还会再来使用。衡量网站用户体验有四个主要因素,分别是品牌、使用性、功能性、内容。关于用户体验没有确切的标准,它随着...
功能:iis日志分析,分析出访问IP总数,搜索引擎抓取次数将日志文件放在网站根目录,并改名为log.log。//打开日志文件$DOCUMENT_ROOT = $_SERVER['DOCUMENT_ROOT'];$fp = fopen("$DOCUMENT_ROOT/log.log",'rb');if ( !$fp ){echo '打开文件失败';exit;} //分析每行日志$num_ip = 0; //访问IP总数$ip = array(); //IP数据数组,其中ip[$i][0]为IP地址、ip[$i][1]为该地址出现次数while ( !feof($fp) ){$line = fgets($fp,1001);if ( substr($line,0,1) == '#' ){//获取日志生成时间if ( substr($line,0,5) == '#Date' ){$date_info = explode(' ',$line);//echo '日志生成时间:'.$date_i...