本文作者:qiaoqingyi

怎么获取网站url地址(怎么获取网站url地址信息)

qiaoqingyi 2023-07-06 255

最近,出去做培训的时候发现越来越多的人开始学习和操作SEO,随之而来的咨询有关seo问题的也越来越多了,每天都有各式各样的问题咨询的,有时候对于同一seo优化问题要重复向网友解答十几遍,鉴于节省对一些常见seo问题解答的时间,我今天特意整理了20个热点seo问答在太原SEO研究中心博客上跟大家分享一下:

官方回复:原则上是不会的。除非新换的服务器太糟糕,三天两头访问失败,或者服务器从国内换到国外,这就很可能被和谐。

(1)、短时间内频繁换域名、二级域二级目录间互换、url规则频繁变化等等;

(2)、新旧网页之间不设置301跳转关系或极短时间内停止了301跳转关系;

(3)、旧网页短时间内就不能访问;

(4)、网站改版后没有在站长平台提交或者很长一段时间后才提交。

正常情况下,网站改版对其在搜索引擎中的表现都将产生少许的损失,一旦出现以上这些问题,将使损失扩大化,这是我们和站长都不希望看到的,因此,希望站长们:

(1)、网站改版要慎重,确信是非常必要的情况下再进行;

(2)、新旧网页之间一定要设置301跳转关系并且使新旧内容及跳转关系保持一段时间直至新网页的抓取、收录及排序达到相对稳定且良好的状态;

(3)、当您做好了网站改版的准备工作后请及时登录站长平台网站改版工具提交相关的数据。

官方回复:任何对用户体验有增益或者减益的做法,其实会影响到用户的“投票”行为。而这些投票行为,又会影响搜索引擎对这个网站的评价算法。所以,弹不弹窗并不重要呀,关键是这种弹窗会对用户造成什么样的影响。

官方回复:java的解析是很多搜索引擎正在做的事情。毕竟有那么多应用java的网站,其实并没有意识到,他们的做法给搜索引擎的收录和索引带来的麻烦。一方面java给搜索引擎障碍,另一方面搜索引擎正在努力攻破这一点。所以,如果期望不被搜索引擎收录的话,最直接的手段,还是写robots文件。更多关于java的详细介绍,大家可以通过太原SEO研究中心博客的《java是什么?java功能有哪些》来具体了解。

展开全文

官方回复:gzip对收录和权重没有影响。对搜索引擎唯一的影响,是抓取速度会快一些。相反在当前是被提倡的,速度快的网站更能获得用户和搜索引擎的好感,并且在站长平台网站优化建议中也提倡站长使用gzip压缩,提升网站速度。

问题描述:很多网站为了提高网站访问速度,网站对静态资源文件使用了独立的无cookie域名。虽然提升了网站的性能,但同时也在网站页面上产生了大量的不属于该网站域名的资源调用链接。例如:seo0351.cn网站将webhtm.com域名做为其图片资源调用的域名来使用,这时在seo0351.cn的页面上调用的图片HTML代码如何判断的呢?是否会将其做为该页面的一个出站链接来判断?如果页面上这类的链接过多,是否会对网站的SEO效果产生影响呢?

官方回答:这是一种非常正当的做法,从网页搜索的角度来看,没有任何直接的影响,和调用本站的资源是一样的。

问题补充:有些网站没有控制用户的行为,可能会产生SPAM页面的情况,数据量太大,垃圾标签+分页的量在700w+的水平,整体提交担心权重被k

官方回复:很多网站喜欢去做TAG,但非用户行为,而是直接抓的网页搜索结果,虽然TAG写的好,但是内容不相关,也属于一种作弊。

太原SEO研究中心博客补充:TAG页和站内搜索页都是一种很有价值的页面,在专业网站内,使用这种形式可以对网站内容进行二次萃取,把网站内容以聚合或专题的形式展现出来,让搜索用户可以更加快捷方便的找到和浏览自己需要的信息。百度原来也很青睐这种页面,因为这些页面可以在一定程度提升百度搜索结果的质量(具体介绍可查看太原SEO研究中心博客的《巧用nofollow和tags让收录暴涨》一文)。

但是随着精明的SEO的介入,发现了这种页面更容易获得搜索排名和流量,进而使得这种页面大部分沦为了恶意抢夺搜索流量的垃圾页面。不顾关键词的质量以及自己网站是否有相关内容,而随意导入关键词和生成页面。由于词本身质量以及和网站定位相关性问题,再加上网站本身内容多少的问题,造成了今天很多网站都在使用这种方法制造垃圾页面的现象。这也是为什么百度会打击这些不相关静态页面。所以在增加网站TAG页的时候一定要注意关键词、内容、TAG的相关性,真实有效的生成标签。

官方回复:如果您不想搜索引擎追踪此网页上的链接,且不传递链接的权重,请将此页标记放入网页的HEAD部分:metaname=”robots”content=”nofollow”;如果您不想百度追踪某一条特定链接,百度还支持更精确的控制,请将此标记直接写在某条链接上:href=“xx”rel=”nofollow”。

百度Spider对网页的抓取,是通过网页与网页之间的链接实现的。网页之间的链接类型,除了站点内部的页面链接之外,还有不同网站之间的互相链接。因此,某些网页即便通过你的网站内部链接无法访问到,但是,如果别人的网站上有指向这些页面的链接,那么这些页面还是会被搜索引擎所收录。

百度Spider的访问权限,和普通用户是一样的。因此,普通用户没有权限访问的内容,Spider也没有权限访问。之所以看上去某些访问权限限制内容被百度收录,原因有两点:

(1)、该内容在Spider访问时是没有权限限制的,但抓取之后,内容的权限发生了变化。

(2)、该内容有权限限制,但是由于网站安全漏洞问题,导致用户可以通过某些特殊路径直接访问。而一旦这样的路径被公布在互联网上,则Spider就会循着这条路径抓出受限内容。如果你不希望这些私密性内容被百度收录,一方面可以通过Robots协议加以限制。

Baiduspider只抓取能从互联网上找到的url,如果Baiduspider大量抓取你网站上不存在的url,可能有两个原因:

(1)、你网站内有部分网页指向其他网页的url格式不正确。

(2)、互联网上有其他网站指向了你网站内不存在的网页。

另外,Baiduspider抓取到不存在的网页,服务器应该返回404错误。

太原SEO研究中心博客补充:很多时候站长在统计后台会发现自己压根就没见过的链接,一般主要的原因是程序生成错误,还有在做内链或外链的时候输写错误。在此,还要提醒大家一点,你网站的错误页面返回的状态码是否是真正的404页面,关于这点我已在太原SEO研究中心博客的《你真的懂404页面设置吗》做个详细的介绍。

描述:220.181.51.* 这个ip段是百度蜘蛛吗?

官方回复:在linux平台下,您可以使用hostip命令反解ip来判断是否来自Baiduspider的抓取。Baiduspider的hostname以*.baidu.com 或*.baidu.jp的格式命名,非*.baidu.com或*.baidu.jp即为冒充。

host 123.125.66.120120.66.125.123.in-addr.arpa domain name pointerbaiduspider-123-125-66-120.crawl.baidu.com.host 119.63.195.254254.195.63.119.in-addr.arpa domain name pointerBaiduMobaider-119-63-195-254.crawl.baidu.jp.

host 123.125.66.120120.66.125.123.in-addr.arpa domain name pointerbaiduspider-123-125-66-120.crawl.baidu.com.host 119.63.195.254254.195.63.119.in-addr.arpa domain name pointerBaiduMobaider-119-63-195-254.crawl.baidu.jp.

在windows平台或者IBM OS/2平台下,您可以使用nslookupip命令反解ip来判断是否来自Baiduspider的抓取。打开命令处理器 输入nslookupxxx.xxx.xxx.xxx(IP地址)就能解析ip,来判断是否来自Baiduspider的抓取,Baiduspider的hostname以*.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。

在mac os平台下,您可以使用dig命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器输入digxxx.xxx.xxx.xxx(IP地址)就能解析ip,来判断是否来自Baiduspider的抓取,Baiduspider的hostname以*.baidu.com 或 *.baidu.jp的格式命名,非*.baidu.com或*.baidu.jp即为冒充。详细内容大家可以查看太原SEO研究中心博客的《解读IIS日志中搜索引擎蜘蛛名称代码及爬寻返回代码》相关介绍,在此我就不再细说了。

描述:Baiduspider-sfkr来过之后,当天网站收录就被K为0了,然后百度蜘蛛还是正常爬取,但就不收录。请问这是怎么回事,没有做竞价的站,居然来了竞价蜘蛛,发现没做竞价就K站?

官方回复:百度的商业推广和自然搜索,是由完全独立的两个部门分别运营两套独立系统。Baiduspider-sfkr的抓取,和网页自然搜索无关,也不会对网页自然搜索产生任何影响。

官方回复:百度目前没有查询外链的查询命令,但在站长平台中支持外链查询。

太原SEO研究中心博客补充:既然百度目前没有查询外链的查询命令,那就以流行的domain命令查询就行,尽管不准确,但只需要知道一个对比值就行,对于外链的数量本身就不需要很精准的知道。我们只需要根据这个数据的波动来判断网站的情况足矣。

图片的直观性明显优于文字,用户通过读图可以在最短时间内就判断出页面主旨,进而快速进入内容详情页面。希望站长不要为了出图文而刻意去做图配图,一定要根据自己的内容以及用户的阅读及使用场景,在适合的情况下进行优化。

(1)、目前站长只需要将图片放在页面主体内容中,百度会进行相应的图片识别及场景识别,后续会提供协议规范;

(2)、图片大小尽量接近121:75;

(3)、图片必须与页面内容紧密相关,如果出现作弊或恶劣低质图片,将有相应的处理机制:A、屏蔽出图,B、降低站内url排序,C、严重者整站将受到影响。

怎么获取网站url地址(怎么获取网站url地址信息)

官方回复:对URL的动静态,没有歧视政策。之所以以前有过提倡静态的说法,是因为很多动态URL,带了很多参数,而实质上内容是一样的。这个给spider以及站长都带来不必要的麻烦。我们在这上边花了不少精力。所以,总的原则就是,URL的动静态无所谓,只是尽可能的避免重复即可。但是动态url也不要动态得太变态,搞几十个参数,那会吓着蜘蛛。

太原SEO研究中心博客补充:伪静态的优点是方便用户记忆,当动态路径没有被抓取的时候,伪静态路径可以弥补解决这个问题,而动态URL不是不好,只不过百度对于百度URL的抓取判断还不是很完善,拿谷歌来说,动态url的参数传递的时候,可以让谷歌更明确的知道该页面是跟什么最相关的,比如参数传递中,Productid=Shoes,谷歌就知道这个页面是鞋子,如果另外一个参数传递Color=White。那谷歌就完全知道了,这是一个关于白色鞋子的页面。而对于想把网站的tag标签改成静态的博友,可以查看太原SEO研究中心博客的《如何实现dedecms(织梦CMS)管理系统TAG标签静态化》介绍方法来修改。

官方回复:搜索引擎排序的出发点是用户的搜索体验。虽说,很多时候尊重原创和用户体验是一致的,但是毕竟也有一些案例,转载的体验会比原创更好,这时原创的排序未必会高于转载者。另外早在半年前我们内部已经专门成立了质量topic团队,专门从内容角度去考虑是否对用户有帮助是否体验好。只要站长可以提供优质的内容,取得比文库、知道等更好的成绩不是问题,前提是与之对比更加优质、用户体验更好。

太原SEO研究中心博客补充:百度目前对于原创的识别还不是非常完善,但是就算百度能很好的识别原创内容,也不是说原创就永远应该排在第一位,就如淏荃君曾经所说原创的排序未必会高于转载者(具体可以查看太原SEO研究中心博客的《我们的网站文章真的需要原创内容吗》文章),因为如果对方从网站权威度、网站级别、加载速度等都比你的好,在你原创的基础上增加了更多的附加价值,体验比你的好上百倍,该不该排在你的前面呢?

官方回复:某人发表了一篇针对某新闻事件的原创博客,随后被新浪转载到了新闻频道。从描述的内容上讲,这是一种重复。但这种重复仅仅是主体内容上的重复,一方面它的转载带来了访问速度、稳定性等方面的增益,并且之后的检索用户还有可能用“新闻事件新浪”来检索此新闻。这可以被称之为站点增益。因此即使主题内容没有任何变化,新浪的这次转载也是有价值的,其稀缺度也是较高的。

同样,反过来说,如果转载的网站相当不知名,则其无法带来站点名、稳定性、速度等的增益。更有甚者,转载之后在页面上加入大量广告妨碍阅读,或者只转载了内容中不完整的一部分,这样的转载,或者说采集,就是纯重复的,与采集源相比,就是没有检索价值的了。

太原SEO研究中心博客补充:搜索引擎是收录重复内容的,只是说随着收录重复内容量的不但增加,合格的附加价值也在增加,想要继续被收录就会变得更加困难,除非你能有更好的附加价值,所以搜索引擎对于重复内容的收录也是有上限的,价值越高的内容肯定上限越高,当重复收录量越接近这个上限,想被收录就越难,这就是之后再选择伪原创的原因,因为内容的改变加大了收录的可能。

官方回复:正如同一个页面上的导出链接越多,每个链接获得的权重越小一样,title上的关键词越多,单个关键词获得的权重也会越低,这是很直观的逻辑。但是如果为追求某个关键词的权重,极力压缩标题长度,那么真正合乎该页面的搜索需求,又很难被命中。所以一般性的建议就是,实事求是的将页面主旨反映在标题中即可。如果要做长青树,不要在乎一时一刻的seo效果,把网站的忠实用户人气做起来就成了。

太原SEO研究中心博客补充:百度搜索结果标题最多显示30个中文字符,谷歌是32个中文字符,所以为了避免网站标题头尾很被切断,网站标题标签最好不要超过30个中文字,但是为了提高用户体验和突出目标关键词,建议长度最好在20-25个左右,因为标题过长,无关字必然会多,不利于突出目标关键词,降低了标题与网站内容的相关性。

官方回复:只要网站稳定可信,能长期供应真实有效的内容就可以获得长期稳定的排名。

太原SEO研究中心博客补充:网站保持长期稳定排名的2大要素。

内容始终是网站的根本,网站的内容质量一定要高,不要糊弄搜索引擎,更不要糊弄用户。网站前期获得排名,外链占了很大一部分因素,而有了排名之后,用户的选择与投票占主要的因素。千万不要想着有网站排名后就感觉轻松了,然后降低更新内容的质量,复制采集都用上,别高兴太早,用户考核的时间才刚刚到,这个时候将内容质量降低无疑告诉用户,你以后可以不用来了。

百度的目的是满足用户需求,保证市场份额,所以你的网站能满足用户需求就能满足搜索引擎的需求,有人说前面说的高质量文章不就是满足了用户需求?的确,用户需求高质量文章,但是需求也是会有改变的。比如一个seo网站,用户的主体需求当然是seo技术文章,但如果某段时间出现大量网站泛解析的情况,用户就需求泛解析相关的文章,如果你的网站没有,用户就会去另一个网站,甚至成为该网站的长期用户。所以,我们需要不断的去发现用户的需求,用户有需求也就是搜索引擎也有需求,而我们就需要去供应这个需求。

官方回复:网站内链必须是相关的,也可以在文章内容里出现指向不同页面的链接,但是要有意义,是引导用户的,推荐给用户的,不要硬性加入,这一点百度百科的链接就做得非常好。

太原SEO研究中心博客补充:很多网站内链都是胡乱的加链接、锚文本,有的是直接自动生成内链,目的很简单:给搜索引擎指路。那么内链为何存在?在之前内链的作用可能更多的是让搜索引擎更好的抓取网站,提升锚文本排名,而现在内链的作用个人认为更多的应该是引导用户,给用户真是有效的推荐。

文章页面里边不要出现指向首页的链接,在内页内容确实有必要的时候可以加首页链接,其他情况都是没必要的,因为用户在内容页想返回首页点击导航按钮就行了,页面上已经有引导了,内容页里再加入这个非常没有必要,只能说明你导航系统差。更多的详细方法介绍大家可以通过太原SEO研究中心博客的《网站内链之网站内部链接策略规划》来具体了解。

或许有人会说首页要做其他的关键词锚文本,所以要在内容页加入这个锚文本指向首页,促进首页这个关键词的排名。而这只是你想当然的给用户推荐,比如你在内容页加入“seo”指向首页,用户因为想进一步了解seo才点击进去,结果又回到首页了,这样用户又得在首页找需求的东西,浪费时间,用户不是搜索引擎,上一次当就不会上第二次,每上一次当你的网站体验就差一分,当用户经常被骗,他就会离你而去。同时在一篇文章里最好不要出现两个指向相同页面的链接,这样会导致优化过度。

官方回复:百度搜索研发部的说法,从四个方面说:

受众群体的大小,即代表了用户检索需求的大小。评价受众的大小主要依据信息发布源的受众和信息内容本身受众两大方面。

稀缺主要是描述页面在互联网中的独特性。说到稀缺往往会想到重复,稀缺是否等同于无重复,我们应该怎样解读这一概念呢?可以看一个例子:

某人发表了一篇针对某新闻事件的原创博客,随后被新浪转载到了新闻频道。从描述的内容上讲,这是一种重复。但这种重复仅仅是主体内容上的重复,一方面它的转载带来了访问速度、稳定性等方面的增益,并且之后的检索用户还有可能用“新闻事件+新浪”来检索此新闻。这可以被称之为站点增益。因此即使主题内容没有任何变化,新浪的这次转载也是有价值的,其稀缺度也是较高的。

所以对于主体内容重复的页面,我们应该评价其是否存在站点增益和内容增益,只有对于大量完全无增益的重复页面,我们才应该认为其稀缺度较低。这就是为什么你的原创为什么在别人那却排名比你好的原因。

页面的质量是它对需求的满足程度的一种体现。判断页面质量的高低,应该是从最基础的需求依次递进的。

首先,不能是死链、网站要有一定的稳定性、访问速度要令人满意。

其次,主体内容是否完整、版式和字体是否易读、各类广告会不会太多。

最后,信息是否丰富、延伸出的次级需求是否满足。

“时效性”是页面价值的一个属性,它一般体现在两个方面:一是页面所描述的事物本身有着较强的公众话题性,容易被传播。这其实是受众的一个体现。二是页面所描述的事物仅在第一时间有较高热度,随着时间推移热度显著下降。这是一种“新闻”性。对于具有上述两种属性的页面,如果搜索引擎spider发现页面的时间正处于该事物的“爆发期”或“爆发期”之前,我们认为该页面具有时效性。

seo优化是一门技术也可以说是总结的经验,技术体验在站内代码的优化和机构层次上,经验体现在对搜索引擎的了解,用户体验的友好性,对数据的把控和预期,seo优化是围绕用户需求价值,网站优化技术与优化经验相结合的学科。

在做SEO优化过程中有问题需要去挖掘求知,但一定要注意方式,在获取答案的同时不能只是一味的接受,在知道答案后我们首先就要去判断其正确性,其次要去实践,答案只是答案,通过这个答案总结出自己的经验和一套技术才是最终目的。

阅读
分享