发布时间:2020/7/27 13:18:04浏览量:
今年5月中旬,百度完成了全站https化。随后,以维基百科为的多家网站也表示将实现全面HTTPS化。HTTPS是以安全为目标的HTTP通道,简单讲是HTTP的安全版。百度曾在5月下旬的公告中明确表示“百度视同一个域名的http版和https版为一个站点,优先收录https版。”因而越来越多的站点也开始考虑Https化问题,但仍有不少站长担心“网站https化对站点流量是否会产生负面影响、怎样才能避免这种影响?”等问题。
对此,百度是如何回复的呢?
问:对于http和https,Baiduspider会不会区别对待?
答:不会区别对待。说得再全整一些:Baiduspider在对于http和https站点的调度和解析方面没有任何区别。至于建索引库,年初的时候百度进行过升级,目前对https站点也是全力支持的。
问:Baiduspider可以抓取https网站吗?站点https以后应该做些什么?
答:在抓取方面,Baiduspider完全支持https链接的抓取。站长需要注意的一点是要保证http链接到https链接良好的重定向(使用301或302),这样百度可以做到无缝切换。另外可以使用链接提交工具提交https链接,尽快通知百度。
问:站点切换https以后,新产生的https页面,百度会将其视为新页面重新收录?重新计算排名?
答:不是的,不涉及重新收录的问题。
问:https以后可以使用改版工具向百度提交http与https的对应关系吗?
答:http站和https站会被百度视为同一个站点,不属于改版,不适用改版工具。
问:https以后,排序有可能发生什么变化?
答:在rank方面,现在对两种链接无区别对待,从安全性考虑,以后可能会优待https的链接。
先谈谈什么是HTTPS:
HTTPS(Secure Hypertext Transfer Protocol)安全超文本传输协议 它是一个安全通信通道,它基于HTTP开发,用于在客户计算机和服务器之间交换信息。它使用安全套接字层(SSL)进行信息交换,简单来说它是HTTP的安全版。 它是由Netscape开发并内置于其浏览器中,用于对数据进行压缩和解压操作,并返回网络上传送回的结果。
HTTPS实际上应用了Netscape的安 全全套接字层(SSL)作为HTTP应用层的子层。(HTTPS使用端口443,而不是象HTTP那样使用端口80来和TCP/IP进行通信。)SSL使 用40 位关键字作为RC4流加密算法,这对于商业信息的加密是合适的。HTTPS和SSL支持使用X。509数字认证,如果需要的话用户可以确认发送者是谁。
HTTPS和HTTP的区别:
https协议需要到ca申请证书,一般免费证书很少,需要交费。
http是超文本传输协议,信息是明文传输,https 则是具有安全性的ssl加密传输协议 http和https使用的是完全不同的连接方式用的端口也不一样:前者是80,后者是443。
http的连接很简单,是无状态的 HTTPS协议是由SSL+HTTP协议构建的可进行加密传输、身份认证的网络协议 要比http协议安全 HTTPS解决的问题:
1、信任主机的问题。 采用https 的server 必须从CA 申请一个用于证明服务器用途类型的证书。
改证书只有用于对应的server 的时候,客户度才信任次主机。所以目前所有的银行系统网站,关键部分应用都是https 的。 客户通过信任该证书,从而信任了该主机。其实这样做效率很低,但是银行更侧重安全。 这一点对我们没有任何意义,我们的server,采用的证书不管自己issue 还是从公众的地方issue, 客户端都是自己人,所以我们也就肯定信任该server。
2、通讯过程中的数据的泄密和被窜改。
1)一般意义上的https, 就是 server 有一个证书。
a) 主要目的是保证server 就是他声称的server。这个跟点一样。
b) 服务端和客户端之间的所有通讯,都是加密的。
i、具体讲,是客户端产生一个对称的密钥,通过server 的证书来交换密钥。 一般意义上的握手过程。
ii、加下来所有的信息往来就都是加密的。 第三方即使截获,也没有任何意义。因为他没有密钥。 当然窜改也就没有什么意义了。
2)少许对客户端有要求的情况下,会要求客户端也必须有一个证书。
a) 这里客户端证书,其实就类似表示个人信息的时候,除了用户名/密码, 还有一个CA 认证过的身份。 应为个人证书一般来说上别人无法模拟的,所有这样能够更深的确认自己的身份。
b) 目前少数个人银行的版是这种做法,具体证书可能是拿U盘作为一个备份的载体。像我用的交通银行的网上银行就是采取的这种方式。 HTTPS 一定是繁琐的。
a) 本来简单的http协议,一个get一个response。由于https 要还密钥和确认加密算法的需要。单握手就需要6/7 个往返。
i、任何应用中,过多的round trip 肯定影响性能。
b) 接下来才是具体的http协议,每一次响应或者请求, 都要求客户端和服务端对会话的内容做加密/解密。
i、尽管对称加密/解密效率比较高,可是仍然要消耗过多的CPU,为此有专门的SSL 芯片。 如果CPU 信能比较低的话,肯定会降低性能,从而不能serve 更多的请求。