转自:https://www.runoob.com/w3cnote/set-ssh-login-key.html

我们一般使用 PuTTY 等 SSH 客户端来远程管理 Linux 服务器。但是,一般的密码方式登录,容易有密码被暴力破解的问题。所以,一般我们会将 SSH 的端口设置为默认的 22 以外的端口,或者禁用 root 账户登录。其实,有一个更好的办法来保证安全,而且让你可以放心地用 root 账户从远程登录——那就是通过密钥方式登录。

密钥形式登录的原理是:利用密钥生成器制作一对密钥——一只公钥和一只私钥。将公钥添加到服务器的某个账户上,然后在客户端利用私钥即可完成认证并登录。这样一来,没有私钥,任何人都无法通过 SSH 暴力破解你的密码来远程登录到系统。此外,如果将公钥复制到其他账户甚至主机,利用私钥也可以登录。

下面来讲解如何在 Linux 服务器上制作密钥对,将公钥添加给账户,设置 SSH,最后通过客户端登录。

1. 制作密钥对

首先在服务器上制作密钥对。首先用密码登录到你打算使用密钥登录的账户,然后执行以下命令:

[root@host ~]$ ssh-keygen  <== 建立密钥对  #或生成pem:ssh-keygen -t rsa -f my.pem -C "your@email.com"
Generating public/private rsa key pair.
Enter file in which to save the key (/root/.ssh/id_rsa): <==  Enter
Created directory '/root/.ssh'.
Enter passphrase (empty for no passphrase): <== 输入密钥锁码,或直接按 Enter 留空
Enter same passphrase again: <== 再输入一遍密钥锁码
Your identification has been saved in /root/.ssh/id_rsa. <== 私钥
Your public key has been saved in /root/.ssh/id_rsa.pub. <== 公钥
The key fingerprint is:
0f:d3:e7:1a:1c:bd:5c:03:f1:19:f1:22:df:9b:cc:08 root@host

密钥锁码在使用私钥时必须输入,这样就可以保护私钥不被盗用。当然,也可以留空,实现无密码登录。

现在,在 root 用户的家目录中生成了一个 .ssh 的隐藏目录,内含两个密钥文件。id_rsa 为私钥,id_rsa.pub 为公钥。

2. 在服务器上安装公钥

键入以下命令,在服务器上安装公钥:

[root@host ~]$ cd .ssh
[root@host .ssh]$ cat id_rsa.pub >> authorized_keys

如此便完成了公钥的安装。为了确保连接成功,请保证以下文件权限正确:

[root@host .ssh]$ chmod 600 authorized_keys
[root@host .ssh]$ chmod 700 ~/.ssh

3. 设置 SSH,打开密钥登录功能

编辑 /etc/ssh/sshd_config 文件,进行如下设置:

RSAAuthentication yes
PubkeyAuthentication yes

另外,请留意 root 用户能否通过 SSH 登录:

PermitRootLogin yes

当你完成全部设置,并以密钥方式登录成功后,再禁用密码登录:

PasswordAuthentication no

最后,重启 SSH 服务:

[root@host .ssh]$ service sshd restart

4. 将私钥下载到客户端,然后转换为 PuTTY 能使用的格式

使用 WinSCP、SFTP 等工具将私钥文件 id_rsa 下载到客户端机器上。然后打开 PuTTYGen,单击 Actions 中的 Load 按钮,载入你刚才下载到的私钥文件。如果你刚才设置了密钥锁码,这时则需要输入。

载入成功后,PuTTYGen 会显示密钥相关的信息。在 Key comment 中键入对密钥的说明信息,然后单击 Save private key 按钮即可将私钥文件存放为 PuTTY 能使用的格式。

今后,当你使用 PuTTY 登录时,可以在左侧的 Connection -> SSH -> Auth 中的 Private key file for authentication: 处选择你的私钥文件,然后即可登录了,过程中只需输入密钥锁码即可。

最近入了一台独立服务器,如果直接拿来跑项目的话就太浪费资源了。于是打算使用Proxmox VE这款虚拟化管理软件进行VPS管理。

Proxmox VE是一款套开源的虚拟化管理软件,用户可通过网页的方式来管理服务器上使用 kvm 以及 lxc 技术运行的虚拟机。同时提供了一些先进功能的支持,如集群、HA等。

0x00 安装

Proxmox VE是基于Debian进行开发的,主要有两种安装方式。
其一是通过官方提供的iso作为一个全新的系统安装
另一种方式是在已有的Debian系统上安装
手动安装时请务必保证网卡配置正确,若出错的话在不带IPMI的机子上很难处理。

安装完成后即可通过https://ip:8006/访问管理页面

另外,这里记录一下版本升级的方法。由于Proxmox VE是一家商业公司在运营,所以一些功能是需要购买订阅才能使用的,例如说版本更新功能。但是可以通过一些方法绕过限制。注意这些更新方法请勿用于生产环境中。

将软件源更改为测试源

修改/etc/apt/sources.list.d/pve-install-repo.list, 将 pve-no-subscription 修改为pvetest
然后apt三连即可更新为新版本。

apt-get update
apt-get upgrade
apt-get dist-upgrade

0x01 相关设定

对于kvm虚拟化的虚拟机,若想上传需要用到的iso文件,可以直接通过网页端上传,也可以直接将文件放入/var/lib/vz/template/iso/
如果想对kvm虚拟机的启动参数进行调整,官方提供了api:qm set,具体可参照官方文档
对于lxc虚拟化的虚拟机,可以直接从系统中下载对应发行版的模板,无需自行下载。
可以直接使用LXC自带的api对lxc虚拟机进行管理,注意-n为虚拟机的id。

0x02 网络配置

对于多ip的服务器,本身官方就是按照桥接的方式做好网络配置的,直接在虚拟机中填写分配的ip即可。
对于单ip服务器,可以采用NAT的方法让虚拟机连上外部网络。这里介绍俩种方式。

采用QEMU自带的NAT

对于KVM虚拟机,可以直接在创建虚拟机的时候勾上NAT,这时候就会自动为虚拟机分配一个虚拟的子网并且虚拟机可以通过nat连接到外部网络,基本上是开箱即用。同时也支持端口映射,具体可参考官方wiki下的QEMU port redirection。但之前在使用的过程中,发现这个端口映射并不是很稳定。同时虽然这种方法很简单,但是虚拟机之间是隔离的,无法互通数据,这样就非常不灵活。
同时,LXC虚拟机是没有这种开箱即用的NAT的。

配置iptables创建子网以实现nat

主要思路是创建一个虚拟桥接设备并创建一个子网,然后将所有虚拟机包括宿主机都连接到这个子网内,再开启iptables的NAT功能。
编辑配置文件/etc/interfaces,以下是参考配置

auto vmbr2
iface vmbr2 inet static
    address 10.0.0.254
    netmask 255.255.255.0
    bridge_ports none
    bridge_stp off
    bridge_fd 0
    post-up echo 1 > /proc/sys/net/ipv4/ip_forward
    post-up iptables -t nat -A POSTROUTING -s '10.0.0.0/24' -o vmbr0 -j MASQUERADE
    post-down iptables -t nat -D POSTROUTING -s '10.0.0.0/24' -o vmbr0 -j MASQUERADE

以上配置创建了vmbr2并且分配了一个子网10.0.0.0/24,同时宿主机(同时亦为网关)在这个子网内的ip为10.0.0.254。然后开启了内核的转发功能与iptables的NAT功能(其中vmbr0为通向外部网络的设备)。
若想添加端口转发直接在iptables中增加相关条目即可。
例如想要将宿主机vmbr0的80端口的tcp连接转发到10.0.0.102的80端口上:
iptables -t nat -A PREROUTING -i vmbr0 -p tcp --dport 80 -j DNAT --to 10.0.0.102:80
如果想保存转发规则,使之重启后依然有效,则需要在/etc/interfaces相应位置加入

post-up iptables -t nat -A PREROUTING -i vmbr0 -p tcp --dport 80 -j DNAT --to 10.0.0.102:80
post-down iptables -t nat -D PREROUTING -i vmbr0 -p tcp --dport 80 -j DNAT --to 10.0.0.102:80

通过以上方法就能组建一个灵活的子网了,kvm虚拟机和lxc虚拟机都可接入,并且都可以有端口转发。由于没有DHCP服务器所以要自行分配ip。注意创建虚拟机的时候将其挂载到vmbr2端口下。
我的服务器只有一个ip,所以内部组网就只能采取这种这种的方法了hhhh。为了充分利用资源,我将80,443端口转发到内部一台虚拟机上,这台虚拟机再使用nginx反代到内网的其它虚拟机,以充分利用单个ip。

启用BBR优化网络

目前的Proxmox VE版本的linux内核版本比较新,已经包含了bbr模块了。

修改sysctl.conf

echo "net.core.default_qdisc=fq" >> /etc/sysctl.conf
echo "net.ipv4.tcp_congestion_control=bbr" >> /etc/sysctl.conf

保存生效

sysctl -p

检测是否已启用bbr模块

lsmod | grep bbr

如果含有bbr即说明内核内已启用bbr模块

如何在不购买订阅的情况下更新Proxmox

作者: JOEL · 2018年6月8日

如果您尚未购买订阅,则Proxmox的“无有效订阅”导航屏幕会在每次登录时显示。

在Proxmox网站上,他们说:“ Proxmox VE是用于企业虚拟化的完整开源平台。”通常,您不为开源软件付费;但是Proxmox的人们已经尽了最大的努力来吓most我们大多数人购买订阅-或至少使我们因没有订阅而感到内gui。

现在,Proxmox是很棒的软件。开发出色的软件需要大量的资源,出色的开发人员……和大量金钱。因此,如果您在商业环境中使用Proxmox,我建议您购买订阅。但是,某些人可能有兴趣将其用于家庭使用或只是为了摆弄,以及由于各种原因中的任何一种,您可能不希望或可能无法购买订阅。本文适合您。

需要明确的是,Proxmox无需许可证即可正常工作。未经许可的版本与付费版本功能相同,但有一个例外:它无权访问经过测试的“企业”更新存储库。这样(没有我要向您显示的更改),您将无法更新Debian软件。哦,当然,每次登录时都会显示小屏幕。

我认为也有一种方法可以摆脱nag屏幕,但在这里我不会打扰。我本人并不介意,只要您登录即可再点击一下。我已经购买了主服务器的许可证,但是对于备用服务器,我决定暂时不每年花费120美元(大约)。事实证明,使Proxmox从“非企业”存储库进行更新非常容易。

通过SSH进入Proxmox主机,或通过Web界面访问其控制台,并制作pve-enterprise.list源文件的副本,如下所示:

root@pve ~# cd /etc/apt/sources.list.d/

root@pve ~# cp pve-enterprise.list pve-no-subscription.list

好,现在我们有了原始文件的副本。如果我们以后购买订阅并想使用企业存储库,我们将能够非常轻松地还原我们所做的工作。现在,编辑原始文件并注释掉其一行;保存并关闭文件。

接下来,打开复制的文件,pve-no-subscription.list然后稍稍更改行。原始行如下所示:

deb https://enterprise.proxmox.com/debian/pve stretch pve-enterprise

要注意的部分是https(将其更改为http,)enterprise.proxmox.com(更改enterprise为download),以及字符串的末尾— pve-enterprise(更改为pve-no-subscription)。不要编辑该单词stretch或该位置出现的任何其他单词;那是Debian版本代号。您编辑的行应如下所示:

deb http://download.proxmox.com/debian/pve stretch pve-no-subscription

保存并关闭文件。现在,更新软件包列表:

root@pve ~# apt-get update

完成后,运行软件升级!

root@pve ~# apt-get dist-upgrade

注意:始终运行dist-upgrade,而不仅是“ apt-get升级”。Dist-upgrade确保所有软件包及其依赖项都已更新。如果仅运行“ apt-get升级”,则可能会中断。相信我; 它曾经发生在我身上!我有一些紧张的时刻,试图找出为什么我的ZFS存储在停电后不会来了强制重新启动系统-和DIST升级,之后重新启动,化险为夷。只需使用dist-upgrade,一切都应该很高兴。

最后,请注意,“无订阅”存储库据说不能保证稳定。通过此渠道到达的更新更有可能是尖端更新和/或测试更新;他们没有经过测试以确保一切稳定。因此,风险自负-再次,如果Proxmox VE在帮助您的业务,请在那儿的人们帮忙购买订阅。他们的技术可能和我们其他人一样需要餐桌上的食物。
————————————————
版权声明:本文为CSDN博主「allway2」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/allway2/article/details/102846374

Let's Encrypt作为一个公共且免费SSL的项目逐渐被广大用户传播和使用,是由Mozilla、Cisco、Akamai、IdenTrust、EFF等组织人员发起,主要的目的也是为了推进网站从HTTP向HTTPS过度的进程,目前已经有越来越多的商家加入和赞助支持。

Let's Encrypt免费SSL证书的出现,也会对传统提供付费SSL证书服务的商家有不小的打击。到目前为止,Let's Encrypt获得IdenTrust交叉签名,这就是说可以应用且支持包括FireFox、Chrome在内的主流浏览器的兼容和支持,虽然目前是公测阶段,但是也有不少的用户在自有网站项目中正式使用起来。

实战申请Let's Encrypt永久免费SSL证书过程教程及常见问题

在今年黑色星期五的时候,Namecheap各种促销活动中也包括年费0.88美元的SSL证书,当时老左也有购买了2个备用学习和适当的放到一些网站中看看效果(据说英文网站谷歌会很喜欢),当时冷雨同学就建议到时候直接使用Let's Encrypt免费SSL,毕竟有很多大公司支持的,比一些小公司提供的免费SSL证书靠谱很多。

虽然目前Let's Encrypt免费SSL证书默认是90天有效期,但是我们也可以到期自动续约,不影响我们的尝试和使用,为了考虑到文章的真实性和以后的实战性,老左准备利用一些时间分篇幅的展现在应用Let's Encrypt证书的过程,这篇文章分享申请的方法教程。

第一、安装Let's Encrypt前的准备工作

根据官方的要求,我们在VPS、服务器上部署Let's Encrypt免费SSL证书之前,需要系统支持Python2.7以上版本以及支持GIT工具。这个需要根据我们不同的系统版本进行安装和升级,因为有些服务商提供的版本兼容是完善的,尤其是debian环境兼容性比CentOS好一些。

比如CentOS 6 64位环境不支持GIT,我们还可以参考"Linux CentOS 6 64位系统安装Git工具环境教程"和"9步骤升级CentOS5系统Python版本到2.7"进行安装和升级。最为 简单的就是Debian环境不支持,可以运行"apt-get -y install git"直接安装支持,如果是CentOS直接运行"yum -y install git-core"支持。这个具体遇到问题在讨论和搜索解决方案,因为每个环境、商家发行版都可能不同。在这篇文章中,老左采用的是debian 7 环境。

第二、快速获取Let's Encrypt免费SSL证书

在之前的博文中老左也分享过几篇关于SSL部署的过程,我自己也搞的晕乎晕乎的,获取证书和布局还是比较复杂的,Let's Encrypt肯定是考虑到推广HTTPS的普及型会让用户简单的获取和部署SSL证书,所以可以采用下面简单的一键部署获取证书。

PS:在获取某个站点证书文件的时候,我们需要在安装PYTHON2.7以及GIT,更需要将域名解析到当前VPS主机IP中。

git clone https://github.com/letsencrypt/letsencrypt
cd letsencrypt
./letsencrypt-auto certonly --standalone --email admin@laozuo.org -d laozuo.org -d www.laozuo.org

然后执行上面的脚本,我们需要根据自己的实际站点情况将域名更换成自己需要部署的。

快速获取Let's Encrypt免费SSL证书

看到这个界面,直接Agree回车。

Let's Encrypt安装成功

然后看到这个界面表示部署成功。目前根据大家的反馈以及老左的测试,如果域名是用的国内DNS,包括第三那方DNSPOD等,都可能获取不到域名信息。

Let's Encrypt国内域名DNS不支持

这里我们可以看到有"The server could not connect to the client to verify the  domain"的错误提示信息,包括也有其他提示错误,"The server experienced an internal error :: Error creating new registration"我们在邮局的时候不要用国内免费邮局。所以,如果我们是海外域名就直接先用域名自带的DNS。

第三、Let's Encrypt免费SSL证书获取与应用

在完成Let's Encrypt证书的生成之后,我们会在"/etc/letsencrypt/live/laozuo.org/"域名目录下有4个文件就是生成的密钥证书文件。

cert.pem  - Apache服务器端证书
chain.pem  - Apache根证书和中继证书
fullchain.pem  - Nginx所需要ssl_certificate文件
privkey.pem - 安全证书KEY文件

如果我们使用的Nginx环境,那就需要用到fullchain.pem和privkey.pem两个证书文件,在部署Nginx的时候需要用到(参考:LNMP一键包环境安装SSL安全证书且部署HTTPS网站URL过程)。在这篇文章中老左就不详细演示Let's Encrypt证书证书的安装,后面再重新折腾一篇文章详细的部署证书的安装Nginx和Apache。

ssl_certificate /etc/letsencrypt/live/laozuo.org/fullchain.pem;
ssl_certificate_key /etc/letsencrypt/live/laozuo.org/privkey.pem;

比如我们在Nginx环境中,只要将对应的ssl_certificate和ssl_certificate_key路径设置成我们生成的2个文件就可以,最好不要移动和复制文件,因为续期的时候直接续期生成的目录文件就可以,不需要再手工复制。

第四、解决Let's Encrypt免费SSL证书有效期问题

我们从生成的文件中可以看到,Let's Encrypt证书是有效期90天的,需要我们自己手工更新续期才可以。

./letsencrypt-auto certonly --renew-by-default --email admin@laozuo.org -d laozuo.org -d www.laozuo.org

这样我们在90天内再去执行一次就可以解决续期问题,这样又可以继续使用90天。如果我们怕忘记的话也可以制作成定时执行任务,比如每个月执行一次。

第五、关于Let's Encrypt免费SSL证书总结

通过以上几个步骤的学习和应用,我们肯定学会了利用Let's Encrypt免费生成和获取SSL证书文件,随着Let's Encrypt的应用普及,SSL以后直接免费不需要购买,因为大部分主流浏览器都支持且有更多的主流商家的支持和赞助,HTTPS以后看来也是趋势。在Let's Encrypt执行过程在中我们需要解决几个问题。

A - 域名DNS和解析问题。在配置Let's Encrypt免费SSL证书的时候域名一定要解析到当前VPS服务器,而且DNS必须用到海外域名DNS,如果用国内免费DNS可能会导致获取不到错误。

B - 安装Let's Encrypt部署之前需要服务器支持PYTHON2.7以及GIT环境,要不无法部署。

C - Let's Encrypt默认是90天免费,需要手工或者自动续期才可以继续使用。

本文固定链接: http://www.laozuo.org/7676.html | 老左博客

nginx可以根据客户端IP进行负载均衡,在upstream里设置ip_hash,就可以针对同一个C类地址段中的客户端选择同一个后端服务器,除非那个后端服务器宕了才会换一个。

nginx的upstream目前支持的5种方式的分配
1、轮询(默认)
每个请求按时间顺序逐一分配到不同的后端服务器,如果后端服务器down掉,能自动剔除。
upstream backserver {
server 192.168.0.14;
server 192.168.0.15;
}

2、指定权重
指定轮询几率,weight和访问比率成正比,用于后端服务器性能不均的情况。
upstream backserver {
server 192.168.0.14 weight=10;
server 192.168.0.15 weight=10;
}

3、IP绑定 ip_hash
每个请求按访问ip的hash结果分配,这样每个访客固定访问一个后端服务器,可以解决session的问题。
upstream backserver {
ip_hash;
server 192.168.0.14:88;
server 192.168.0.15:80;
}

4、fair(第三方)
按后端服务器的响应时间来分配请求,响应时间短的优先分配。
upstream backserver {
server server1;
server server2;
fair;
}

5、url_hash(第三方)
按访问url的hash结果来分配请求,使每个url定向到同一个后端服务器,后端服务器为缓存时比较有效。
upstream backserver {
server squid1:3128;
server squid2:3128;
hash $request_uri;
hash_method crc32;
}

在需要使用负载均衡的server中增加

proxy_pass http://backserver/;
upstream backserver{
ip_hash;
server 127.0.0.1:9090 down; (down 表示单前的server暂时不参与负载)
server 127.0.0.1:8080 weight=2; (weight 默认为1.weight越大,负载的权重就越大)
server 127.0.0.1:6060;
server 127.0.0.1:7070 backup; (其它所有的非backup机器down或者忙的时候,请求backup机器)
}

max_fails :允许请求失败的次数默认为1.当超过最大次数时,返回proxy_next_upstream 模块定义的错误

fail_timeout:max_fails次失败后,暂停的时间

 

Hbase hbck

[plain] view plain copy

在CODE上查看代码片派生到我的代码片

  1. 新版本的 hbck 可以修复各种错误,修复选项是:
  2. (1)-fix,向下兼容用,被-fixAssignments替代
  3. (2)-fixAssignments,用于修复region assignments错误
  4. (3)-fixMeta,用于修复meta表的问题,前提是HDFS上面的region info信息有并且正确。
  5. (4)-fixHdfsHoles,修复region holes(空洞,某个区间没有region)问题
  6. (5)-fixHdfsOrphans,修复Orphan region(hdfs上面没有.regioninfo的region)
  7. (6)-fixHdfsOverlaps,修复region overlaps(区间重叠)问题
  8. (7)-fixVersionFile,修复缺失hbase.version文件的问题
  9. (8)-maxMerge <n> (n默认是5),当region有重叠是,需要合并region,一次合并的region数最大不超过这个值。
  10. (9)-sidelineBigOverlaps ,当修复region overlaps问题时,允许跟其他region重叠次数最多的一些region不参与(修复后,可以把没有参与的数据通过bulk load加载到相应的region)
  11. (10)-maxOverlapsToSideline <n> (n默认是2),当修复region overlaps问题时,一组里最多允许多少个region不参与
  12. 由于选项较多,所以有两个简写的选项
  13. (11) -repair,相当于-fixAssignments -fixMeta -fixHdfsHoles -fixHdfsOrphans -fixHdfsOverlaps -fixVersionFile -sidelineBigOverlaps
  14. (12)-repairHoles,相当于-fixAssignments -fixMeta -fixHdfsHoles -fixHdfsOrphans
  15. 新版本的 hbck
  16. (1)缺失hbase.version文件
  17.  加上选项 -fixVersionFile 解决
  18. (2)如果一个region即不在META表中,又不在hdfs上面,但是在regionserver的online region集合中
  19.  加上选项 -fixAssignments 解决
  20. (3)如果一个region在META表中,并且在regionserver的online region集合中,但是在hdfs上面没有
  21.  加上选项 -fixAssignments -fixMeta 解决,( -fixAssignments告诉regionserver close region),( -fixMeta删除META表中region的记录)
  22. (4)如果一个region在META表中没有记录,没有被regionserver服务,但是在hdfs上面有
  23. 加上选项 -fixMeta -fixAssignments 解决,( -fixAssignments 用于assign region),( -fixMeta用于在META表中添加region的记录)
  24. (5)如果一个region在META表中没有记录,在hdfs上面有,被regionserver服务了
  25. 加上选项 -fixMeta 解决,在META表中添加这个region的记录,先undeploy region,后assign
  26. (6)如果一个region在META表中有记录,但是在hdfs上面没有,并且没有被regionserver服务
  27. 加上选项 -fixMeta 解决,删除META表中的记录
  28. (7)如果一个region在META表中有记录,在hdfs上面也有,table不是disabled的,但是这个region没有被服务
  29. 加上选项 -fixAssignments 解决,assign这个region
  30. (8)如果一个region在META表中有记录,在hdfs上面也有,table是disabled的,但是这个region被某个regionserver服务了
  31. 加上选项 -fixAssignments 解决,undeploy这个region
  32. (9)如果一个region在META表中有记录,在hdfs上面也有,table不是disabled的,但是这个region被多个regionserver服务了
  33. 加上选项 -fixAssignments 解决,通知所有regionserver close region,然后assign region
  34. (10)如果一个region在META表中,在hdfs上面也有,也应该被服务,但是META表中记录的regionserver和实际所在的regionserver不相符
  35. 加上选项 -fixAssignments 解决
  36. (11)region holes
  37. 需要加上 -fixHdfsHoles ,创建一个新的空region,填补空洞,但是不assign 这个 region,也不在META表中添加这个region的相关信息
  38. (12)region在hdfs上面没有.regioninfo文件
  39. -fixHdfsOrphans 解决
  40. (13)region overlaps
  41. 需要加上 -fixHdfsOverlaps
  42. 说明:
  43. (1)修复region holes时,-fixHdfsHoles 选项只是创建了一个新的空region,填补上了这个区间,还需要加上-fixAssignments -fixMeta 来解决问题,( -fixAssignments 用于assign region),( -fixMeta用于在META表中添加region的记录),所以有了组合拳 -repairHoles 修复region holes,相当于-fixAssignments -fixMeta -fixHdfsHoles -fixHdfsOrphans
  44. (2) -fixAssignments,用于修复region没有assign、不应该assign、assign了多次的问题
  45. (3)-fixMeta,如果hdfs上面没有,那么从META表中删除相应的记录,如果hdfs上面有,在META表中添加上相应的记录信息
  46. (4)-repair 打开所有的修复选项,相当于-fixAssignments -fixMeta -fixHdfsHoles -fixHdfsOrphans -fixHdfsOverlaps -fixVersionFile -sidelineBigOverlaps
  47. 新版本的hbck从(1)hdfs目录(2)META(3)RegionServer这三处获得region的Table和Region的相关信息,根据这些信息判断并repair

示例:

[plain] view plain copy

在CODE上查看代码片派生到我的代码片

  1. 查看hbasemeta情况
  2. hbase hbck
  3. 1.重新修复hbase meta表(根据hdfs上的regioninfo文件,生成meta表)
  4. hbase hbck -fixMeta
  5. 2.重新将hbase meta表分给regionserver(根据meta表,将meta表上的region分给regionservere)
  6. hbase hbck -fixAssignments

##############################################
#### SSH Tunnel; 经测试,已经打通
##############################################
# 公网服务器外网IP: 115.28.9.136
# 公网服务器内网IP: 10.144.7.195
# 内网服务器内网IP: 10.144.7.191

### 1 先登录 115.28.9.136

ssh root@115.28.9.136 -p 22

#通过 webmin 修改 ssh配置,并应用变更
# 实质是 /etc/ssh/sshd_config 文件
GatewayPorts yes
### 2 在 136 上登录 10.144.7.191

ssh root@10.144.7.191 -p 22

### 3 在 10.144.7.191 上执行:
# 即通过此SSH后台登陆 195机器,监听了 195:19122端口,
# 此时访问 136:19122 的请求,相当于都转发到本地的22端口了。
# -Nf 是后台命令的意思
ssh -Nf 10.144.7.195 -R 19122:10.144.7.191:22

# 此时,客户端通过 115.28.9.136:19122 登录,实际上登陆的就是 10.144.7.191:22 服务器了。

你可以通过运行以下命令。

sudo yum install epel-release

现在可以使用yum命令安装Node.js了。

sudo yum install nodejs

因为在开发过程中我需要管理节点包,我还要安装新公共管理的软件包管理器,使用以下命令。

sudo yum install npm

Vultr是一家提供日本、美国、欧洲等多个国家和地区机房的VPS主机商,硬盘都是采用SSD,VPS主机都是KVM架构,VPS配置最少的内存768MB、硬盘为15GB的VPS只要5美元/月,vultr是根据时长来扣费的,使用多长时间就算多长时间,扣对应的款。

Vultr VPS新注册用户赠送50美元优惠活动(可免费使用VPS时间为2个月)

Vultr针对新用户的优惠又来了!! 这次直接注册即送50美金使用60天。60天后50美金自动失效! 本次活动需要信用卡或者或者paypal付款!paypal付款需要充值五美元,信用卡付款则会扣除2.5美元预授权费用(只是预授权,之后钱会回到你的信用卡的)。 2016年1月开始,vultr再次升级月流量,最低配置从原先的400GB增加到目前的1000GB,可以说非常超值,另外vultr 打算2016年一季度在亚洲扩充一个机房数据中心,目前选择是中国香港,韩国首尔,新加坡中的一个,所以,为了避免linode机房那种新用户限制选择东京机房的政策,如果未来有打算使用vultr上面机房数据中心的,建议现在就先注册好账号。

2016.4.7更新 vultr优惠码:NGINX20    新注册用户免费赠送20刀,有效期1年时间!

此外,Vultr VPS除了赠送50美元两个月的计划外,其他的计划都在打8折!无需输入优惠码! (vultr 是禁止用户重复注册账号的,即如果你的支付信息有2个账号在使用,那么你的账户会被关闭)

下面给出具体教程(2016.3.2vultr官网更新,本教程也相应更新):

点击这里查看官网:地址直达

3201

活动地址:http://www.vultr.com/freetrial/

注意:这个是一个新注册用户的优惠活动,所以需要新的账户。点击Sign Up and get $50 for free

3202

vultr 是禁止用户重复注册账号的,即如果你的支付信息有2个账号在使用,那么你的账户会被后台关闭的。简单的说就是一个账户的支付信息比如paypal 账号是对应唯一的一个的,如果你再次使用这个paypal支付另外一个新注册的账号的话,那么账户就会被关闭。所以,重复的注册账号是不可取的。

特别提醒

有部分朋友出现购买vultr的VPS在使用几天甚至付款验证后账户就被关闭,主要原因vultr 是禁止用户重复注册账号的,即如果你使用的paypal或者信用卡已经绑定了Vultr其他账号,那么你新注册的账户会被后台关闭的。简单的说就是一个账户的支付信息比如paypal 账号是对应唯一的一个的,如果你再次使用这个paypal支付另外一个新注册的账号的话,那么账户就会被关闭。所以,重复的注册账号是不可取的。

一 选择信用卡支付

填写信用卡信息,这个预扣款$2.5美元,后面会返还。另外使用优惠码 :NGINX20 可以获得vultr赠送的20美元一年使用权。

3203

这里一个很好的建议是你充值$10美元,防止你被误判恶意使用,如果你使用优惠码NGINX20 ,会被人工审核。这样你就可以免费使用VPS期限7个月了。

二 Paypal支付Vultr (仅限paypal 支付查看,信用卡支付的请忽略)

如果说你没有信用卡,但是你有Paypal 账号,那么你需要先点击上面的Expires 60Days From Today 后面的Remove按钮(谨慎操作,Vultr只给一次机会,选择信用卡的同学切勿选择,本操作仅限paypal支付同学使用 ),输入优惠码 NGINX20 获得20美元一年的使用权。

4701

服务器创建

账单信息确认完成,我们就可以点击右侧的3206 Deploy New Server  建立VPS了。

硬盘默认

服务器选择日本 东京(目前日本线路比较绕,选择洛杉矶比较好)

操作系统默认

服务器配置:默认即可。

其他信息默认即可。

点击 place order ,生成一个新VPS。

3207 3208 3209

进入 Servers ,稍等片刻服务器信息就生成了。

3212

点击 Cloud Instance 进行管理。

3211

Vultr 的这个控制面板还是比较清新的,VPS的所有功能都在一个页面集中,服务器停止,重新启动,重装系统,删除服务器等指示清晰,非常容易管理。

3210

按照上面的配置信息我们登录putty,注意vultr 端口号是22. 初次登录密码就是Initial Password 里面的信息,登录后就是我们常规的操作了。

简单简介下putty的使用

首先按照vultr 给我们的信息填写,IP选择控制面板的IP,端口22,选择SSH模式

461

点击open,会有一个窗口,选择是。

462

login as填写 root.密码填写vultr提供的密码。

putty的密码输入进去是不显示的,所以这里的正确操作步骤是:先复制vultr给的密码,注意复制的密码前后不能有空格(如上图正确密码cteyjukrieh!5),然后先鼠标左键点击下putty软件,再在绿色光标那里鼠标右键一下,然后回车键(Enter建)。这里最关键,好多朋友密码总是输入不对,要么是密码复制错误多了空格,要么就是因为没有看到密码显示就多鼠标右键,多复制了几次密码。正确复制密码回车后的界面是这个样子。

464

 vultr相关性能测试

如果你对速度还不爽,还可以做下优化,比如改进下TCP算法:hybla。 或者安装锐速.

TCP算法代码:

加载tcp_hybla模块(OpenVZ在这一步就会报错):

/sbin/modprobe tcp_hybla

然后查看是否已经正常加载:

lsmod |grep hybla

如果你的内核版本较新,比如CentOS 6.x的2.6.32,则可以用下列命令查看当前可用的拥堵算法,里面应该有hybla了:

sysctl net.ipv4.tcp_available_congestion_control

sysctl net.ipv4.tcp_congestion_control=hybla

编辑

vi /etc/sysctl.conf

在文档末行增加

net.ipv4.tcp_congestion_control= hybla

保存加载:

sysctl -p

然后重启即可。

其他可以参考:

我们用这个日本东京VPS来看视频,浏览网页的话是非常给力的。

在本站内购买vultr,加QQ:2102629796,获得免费搭建ss。

锐速给我们tcp连接加速

安装锐速

wget -N --no-check-certificate https://raw.githubusercontent.com/91yun/serverspeeder/master/serverspeeder-all.sh && bash serverspeeder-all.sh

卸载锐速

chattr -i /serverspeeder/etc/apx* && /serverspeeder/bin/serverSpeeder.sh uninstall -f

根据屏幕提示输入 serverSpeederInstaller 其他信息默认,遇到Y或者N的地方,全部选Y.

然后我们按照图片的数据指示,一路回车就可以了。

11707

现在打开你的浏览器试试速度吧,有图为证

vultr

如果你安装没有效果,编辑一下命令

vi /serverspeeder/etc/config

然后rsc和maxmode设置参数修改为1.然后在进行重启

/serverspeeder/bin/serverSpeeder.sh restart

常用命令

启动锐速:

/serverspeeder/bin/serverSpeeder.sh start

停止锐速:

/serverspeeder/bin/serverSpeeder.sh stop

查看锐速是否正常运行

service serverSpeeder status

检查是否有appex0模块:lsmod

lsmod

32

整体感受

笔者是2012年进入SEO和个人站长这个行当的,4年时间不算长也不算短,12年年底时读这本书第1版,但那个时候有很多其实是看不懂的,《SEO实战密码》这本在SEO界被封为圣经的书,积极意思在于整体详细的梳理了SEO的思路,但也带来了很大的消极影响,早期包括到现在中国大陆SEO粗暴的伪原创、发外链的行为很大程度上受了此书影响。

这本书是以研究Google为主,外链因素在当前包括谷歌、必应在内的外国搜索引擎中还是重要,但目前在百度中因素比较小,12、13年正好是百度算法大规模变动的时候,个人觉得百度的算法调整比Google更为合理自然,可能是因为国情不同。整个第3版600多页,就中国大陆人来看很臃肿,毕竟中国大陆以百度为主,书中包括外链、作弊方式等等很多都过时了,但这本书只有新增补充,并没有做太多相应的删减。

尽信书不如无书,学会带着自己思维去看去做会更好,SEO算法本就不是公开的,一旦公开可能又会有很多作弊手段出现,但现在百度官方给出了很多良好的建议应该认真关注,SEO趋势会更加自然,更强调用户体验。本整理按书中章数编写,删减冗余过时当下不常见的内容,补充百度站长平台官方意见及自己的总结,希望对大家有所帮助。

注:本文有将近一半内容为笔者经验总结,其余捡其要者录之,做SEO除了看书外,注意多看下百度官方建议,然后多尝试,总结出自己的思路,希望对大家有用。本经验总结侧重于于中文搜索引擎优化。

《SEO实战密码(第3版)》精华整理

第一章 为什么要做SEO

1、SEO定义

SEO 即Search Engine Optimization,中文译名“搜索引擎优化”,通过对网站内部调整优化及站外优化,使网站满足搜索引擎收录排名需求,在搜索引擎中关键词排名提高,从而把精准用户带到网站,获得免费流量,产生直接销售或品牌推广。(通俗来讲:SEO即百度自然排名,一般所说的搜索引擎指综合搜索,除此外还有垂直搜索和站内搜索。)

2、SEO有什么用 SEO与推广的对比区别

互联网各应用使用比例

《SEO实战密码(第3版)》精华整理

流量入口占比

《SEO实战密码(第3版)》精华整理

SEO有什么用:

SEO是目前给网站带来流量最好的方法,其他推广营销方法做的好也会很不错,但相比之下,SEO的人力资金成本会低很多,所以SEO适合人力资金有限的中小公司和个人,竞价、网推、电销、地推等适合人力资金充裕追求效率的大型公司,大型公司如果重视SEO更是势如破竹。

SEO与推广的区别:

1、搜索引擎从诞生到现在的使用率一直居于前列,几乎所有人都有搜索需求,流量集中;其他应用兴衰无常,流量分散,使用人群有着明显的年龄行业兴趣区别。

2、SEO的展示是用户主动搜索其需要的信息,进入官网,转化率高且友好;网络推广或者电话地推都会使人反感,而且需要二次转化到官网实现销售或广告变现,需要能力优秀的销售人员。

3、网站有用户关注的内容,可以留住访客;只是产品介绍的网站,访客可能就只是需要时访问或者长期不访问而废弃。

4、质量好的网页可以长期存在搜索引擎结果中获得流量;推广推则有不推则无,热度很容易被掩埋。

5、好做SEO建好网站,做好内容就可以了,成本相对而言较低;而成功的推广营销需要耗费大量的人力和资金。

SEO 与推广区别举例:如果将营销比作泡妞,那么SEO是吸引女生,推广则是的追求女生,吸引女生需要外在的气质和内在的品质,就像做好SEO需要顺畅的网页和优质的内容;追求女生,需要百般的技巧和大量的时间,推广亦是如此,每个人都有适合的自己方式,但一般而言,吸引女生比追求女生可靠些。

3、做好SEO的要素

那是不是说SEO就没有成本,很容易做呢?显然不是,成功的SEO可能每天从搜索引擎获得几十万的流量,而大量的网站从搜索引擎获得流量微乎其微甚至没有,在内容泛滥和搜索引擎算法进步的今天SEO是一个脚踏实地的机会和挑战。

做好SEO需要:思维、耐心、时间、运气

4、SEO做的非常好的网站举例:

企业门户站:金投网:投资理财门户,黄金和白银、股票、外汇、P2P等多个二级域名分站目录链接交错,网站结构布局庞大,内容优质,SEO性质的问答价格和分析文章合理布局,内容优质排版良好,SEO到极致,预估每天从搜索引擎获得百万IP。

个人门户站:三联网:个人综合门户网站,IT教程、素材资源、生活百科、诗词文学等几乎囊括所有搜索需求,三级目录繁多,内容丰富,文章注重网友搜索特点,预估每天从搜索引擎获得50万IP。

公司官网站:无忧主机:虚拟空间公司官网,小IDC商,通过大量的DEDECMS、PHPCMS、WordPress、EMLOG、Discuz!、服务器、数据库等等教程文章,获取搜索引擎流量,文章虽然是复制的,但都有经过一些修改,经常搜索相关CMS问题可以看到其排名,因为大量来源是文章长尾,所以站长工具的预计就不太准,预估每天从搜索引擎获得几千甚至过万IP。

第二章 了解搜索引擎

1、搜索引擎工作原理

《SEO实战密码(第3版)》精华整理

1、爬行抓取:搜索引擎蜘蛛跟踪链接,抓取页面html代码存入数据库,低权重复制内容过滤;

2、预处理:文字和相关标签抓取,中文分词,去掉无意义内容提炼页面主要关键词(对于蜘蛛没有意义:如:的、啊、从而等,广告、申明等),去重(同一内容不同网站或同一网站不同网址);倒排索引:关键词到内容,链接投票,文件处理(目前只能根据标签和相关描述文字识别),质量判断:搜索引擎算法;

3、排名:中文分词(排除无实际意义的词后对搜索词的拆分重组,百度快照可查询分词结果),相关性计算:越常用的词对搜索词的意义贡献越小,词频,关键词位置形式距离(标题、H1、黑体等),链接分析(锚文本、周边文字、原站本身主题),排名过滤调整(百度第11位)。

2、链接原理:

1、李彦宏超链专利(关键词锚文本);

2、Gongle PR(页面链接投票,作弊链接排除,Google2014年10月表示停止更新,最后更新时间为2013年12月6号),pr只是谷歌排名算法中200多个因素之一,搜狗评级类似;

3、Hilltop算法提示外部链接更应该主题相关。

3、用户关注点击程度

谷歌英文点击率参考(2014):第一页71%,第1位31%,第2位14%,第3位10%,第6-10为4%,处于分屏之处的第6位不利于展现和点击,搜索引擎结果页展示效果不断变化中,中文习惯并不完全符合上述点击特点。

搜索引擎结果关注点击程度,英文点击更具“F型”金三角,中文结果前十名查找时间更长,点击差距相比于英文平和。

SEO应尽一切力量方法丰富自己页面的展现格式,图片、目录、开放数据等,排名重要,展现方式也越来越重要。

4、高级搜索指令

site: 收录,百度以索引为准,link:谷歌随机外链,百度不支持,“”全文搜索,-排除(如“苹果 -电影”:排除电影),*通配符(百度不支持),inurl:搜索词出现在url中的页面(如“inurl:zhanzhangdaohang”百度不支持),inanchor:导入链接锚文字包含搜索词页面(如“inanchor:网络热词”百度不支持),intitle:页面标题包含关键词

高级使用:Inurl:.edu.cn intitle:交换链接 愿意交换链接的中国学校网站

5、搜索引擎份额

搜索引擎简史:1994年Yahoo!诞生,1998年Google诞生,2000年百度诞生,2012年360搜索(好搜)推出。

《SEO实战密码(第3版)》精华整理

国内搜索引擎份额(2016年1月预估):PC端份额大致为:百度50%,好搜30%,搜狗15%;移动端百度80%,神马14%,搜狗5%,按PC与移动平分来算,整体份额比约为百度:好搜:搜狗:神马=65%:15%:10%:7% ,神马可能比搜狗高一点,必应中国、谷歌香港份额可忽略。

全球搜索引擎份额(2015年12月):Google-Global、Bing、百度、Yahoo–Global份额比为66.04%、14.61%、9.61%、7.66%。

6、搜索引擎重要算法历程:

早期关键词和外部链接成为Google/百度两个主要排名因素,也就导致很多人为了SEO而欺骗搜索引擎,如堆砌关键词和发布大量外链(甚至批量生成),来获得搜索引擎重视排名,降低了用户体验的同时砸了搜索引擎口碑也扰乱了SEO良性发展,故而促使搜索引擎算法改进,而现在这么做的大多收到了惩罚。

2011年,Google推出熊猫算法,打击低质内容页面;

2012年,Google推出企鹅算法,打击作弊链接和垃圾链接;

2012年,百度多次出现大面积K站排名甚至收录清零,有针对垃圾内容和链接;

2013年,百度推出绿萝算法,打击垃圾链接和买卖链接;博客论坛群发买卖。

2013年,百度推出石榴算法,打击低质量内容页面,弹窗广告;

2013年,百度推出起源算法,打击采集站、伪原创站;

2015年,百度尝试推出原创保护,提升原创内容排名并标识,提出扶持新站的“蝶变”计划。

2011年至今,Google/百度算法的改变,使SEO更加自然,更强调用户体验。2012年以来,百度对SEO也更加开放推出完善站长平台及工具,官方给出指导文档,并积极的与网站SEOer沟通。

第三章 竞争研究

1、关键词分析

关键词原则:关键词决定了栏目内容规划、链接结构等重要后续步骤,需要注意主题内容相关,不同词商业价值,主关键词不可太宽泛,确保目标关键词有人搜索,降低优化难度,寻找有效流量(地区与业务与公司贴合),善用工具。

竞争程度:搜索结果数、竞价结果数、内页排名数、大型著名门户数(站长之家工具)

竞争对手分析:百度权重(第三方)/搜狗评级<谷歌pr2014年停更>、alexa预估流量/爱占、站长之家预估百度流量、网站年龄(域名年龄)、收录、外链、社交网络曝光

建立关键词库:按首页、频道、栏目划分,长尾扩展规则举例

关键词分组:行业细分、地区分类、部位分类等

关键词分类:信息类:小米手机怎么样,导航类:小米手机官网(品牌),交易类:小米手机价格。

关键词波动预测:行业趋势、季节特性、社会热点(百度风云榜、最新网络事件热词)

2、关键词布局

首页(行业词、品牌词)-频道(大分类词)-栏目(主词、栏目名分类词)专题/标签(热门内容知识点集合)-文章(文章长尾)<商城:产品描述等同文章>

3、关键词挖掘途径

1、爱站/站长之家长尾词挖掘工具。此工具挖掘出的长尾词按照百度指数排列,没有百度指数的不会出现,故而是最重要的长尾词工具。

2、百度搜索框下拉词和百度相关词。百度相关词和百度提示框下拉词是搜索量很大的,除了有部分是同行刷出来词,因此此类词也是非常重要的长尾。

3、百度知道平台。百度知道作为最大的中文问答平台,积聚了无数网友的提问,虽然其中不乏互刷关键词的,但算是不错的参考,输入主词,出现的有针对性的都可算作长尾词。

4、百度搜索风云榜。百度、谷歌、搜狗等热门搜索词、事件。

5、头脑风暴。自己是人,能想到的长尾词,自然也有人会想到会搜索。

6、同行网站。别人有所研究的就用价值,没研究乱搞的也不会有什么价值,注意识别。

《SEO实战密码(第3版)》精华整理

4、关键词扩展方式

1、品牌

手机 - 苹果手机、三星手机、小米手机等

2、地区和行业

地区:网站建设 - 北京网站建、上海网站建设、温州网站建设等

行业:SEO-医疗SEO、金融SEO、游戏SEO等

3、限定和形容词

为扩展词加上一些限定词或者形容词进行组合。如免费、促销、价格等这些限定词都是大家经常搜索的,还有便宜、怎样、是什么、好吗、评测、图片等也是常见的限定词。如:

电视机 - 电视机价格、电视机促销等。

服务器 - 企业服务器、VPS、免费空间。

4、关键词变形

1) 同义词

酒店:宾馆、住宿、客栈等

2) 相关词

网站建设:网页设计、网络营销、SEO

3) 简写

清华大学简称清华、北京大学简称北大、Photoshop简称PS

4) 常用输入法、同音词

罗辑思维:逻辑思维

5、网站诊断

百度/好搜/搜狗/神马站长平台、robots文件、首选域(是否带www,其他不解析或者301)、外部链接(百度已经下架外链工具,谷歌和百度都在打击垃圾外链,内容为主,外链顺其自然,回到推广引流的正确位置,禁大量垃圾无意义外链)。

内链、抓取错误统计(服务器、tttp、抓取异常等)、百度模拟抓取是否正常、移动友好检测、网址是否唯一(301或者robots)。

第四章 网站结构优化

目前搜索引擎只能抓取文字,图片、视频无法识别只有通过便签说明。

蜘蛛陷阱:flash、session id(跟踪用户访问生成网址参数)、框架架构(Frame)、动态url(数据库生成带有?=及参数的网址,目前抓取来说没有问题,过多参数还是不利于搜索引擎,建议生成静态,伪静态注意url唯一)、js、强制使用cookie。

导航清晰:树状结构,主次栏目导航、面包屑导航(当前位置)、避免页脚堆积栏目。

网站权重布局:首页>频道>栏目>文章页;子域名>目录。

禁止抓取:nofollow:不跟踪链接,不传递权重和锚文本;robots:禁止抓取网站内容,如淘宝网全站禁止,一般禁止抓取后台及数据库信息,可以屏蔽目录来解决重复收录的问题(如:http://xxx.xxx.com/robots.txt),Canonical:地址规范标签。

动态url:数据库生成带有问好、等号及参数,容易让搜索引擎限于死循环,现在抓取没有问题,容易造成重复,所以建议Url静态化、伪静态(url重写)。

Url规范:越短越好、注意目录层次。

网站地图:用户看的文字栏目地图和给搜索引擎的链接xml地图。

尽可能多的曝光内链促进收录和内部投票(织梦做到了极致:头条、推荐、幻灯、特荐、相关、排行、最新等)。

第五章 页面优化

1、title

不同网页标题不一致,网页相关,字数限制(30个中文字符),尽量不要堆砌,关键词出现最前面,吸引点击,一个页面关键词控制在3个内,标题不要写没意义的词句,关键词之间的连接符:_、-、〉、|。

2、description

现主流搜索算法不采用,搜索结果采用,影响点击,如果与不包含搜索词则提取内文或随机。77字符,首页、栏目、自己写,内容也提取摘要便签,或者正文前几十个字符,或者留空。

3、keywords

现主流搜索算法不采用,内容页调用tag标签或留空。

4、正文

词频与密度,以前说密度在2%-8%之间,现在的重要性降低,内容页长尾关键词2次左右,正文第一段、中间、结尾穿插,首页、栏目主词无定数,自然恰当,合适融入,切莫堆砌。

网页内标签:H(H1-H6,标题)、黑体(内容重点)、alt(图片说明)

关键词的变形多次、组合、拆分,有助于提取页面主题

语义相关:算法通过词与词之间是否经常出现在同一网页分析他们之间的联系,如优化“奥巴马”,多出现白宫、美国等能帮助搜索引擎页面真正意思。

用户体验:段落清晰,主次分明,重点加黑,第一屏是否有实质内容、广告是否影响浏览。

5、精简代码

css的冗余、css/js外部调用、减少删除注释,控制页面大小(128kb,过大影响打开速度和抓取)

6、内部链接合理,过大总体排名降低;

7、外部链接相关性帮助与提升自身页面相关性。

8、保持合理的页面更新频率及数量

9、社会化分享:如百度分享、评论可能会作为页面受欢迎参考值。

Google沙盒期:新站或长期不更新网站突然大量更新增加大量外链等不正常现象的排名呢后移,Google会有6个月左右,百度新站很注重网站内容质量。

10、文章优化注意点(呓城经验总结)

1、标题:具有用户搜索属性,多有疑问词,比如是什么、怎么办等,可以用复合标题

2、摘要:摘要言简意赅,能概况文章内容,或起到引导作用,包含关键词

3、结构:排版工具格式化,段落清晰;格式化编辑,分段小标题、关键词加粗;可以用1234、一二三四目录格式,添加图片,这两种对用户体验和当前搜索引擎结果页展示都很良好

4、内容:不要完全照抄,多篇文章整合,加上自己描述,删繁就简,注重内容对用户的价值,谨慎做标题党文无题意,或者文章内容过多没有重点标识用户难以找到想知道的内容等损害用户体验的事情

第六章 外部链接建设(百度官方意见)

百度多次打击外链,并且已经下架外链工具,SEO已经从以前单纯发外链就可以得到排名,到现在极度注重内容的阶段,这是好事,我表达下我的观点,我认为外链工作应该从SEO中剔除,我承认高权相关的外链人仍有排名助力,但不要刻意,低质垃圾外链有害无用,还有一点,做长尾不要发外链,不然很容易抢占自身的排名,恢复起来时间很漫长,总得来说就是,做SEO不要再发外链了,注重关键词内容质量优化,外链应该回到推广引流的正确位置,而非继续浪费时间制造互联网垃圾,友情链接对SEO依然很重要。

百度官方:外链的作用(2014版)

曾经,“内容为王超链为皇”的说法流行了很多年,通过超链计算得分来体现网页的相关性和重要性,的确曾经是搜索引擎用来评估网页的重要参考因素之一,会直接参与搜索结果排序计算。但随着该技术被越来越多的SEO人员了解,超链已经逐渐失去作为投票的重要意义,无论是谷歌还是百度,对超链数据的依赖程度都越来越低。那么,在现在,超链在发挥着怎样的作用?

1, 吸引蜘蛛抓取:虽然百度在挖掘新好站点方面下了很大工夫,开放了多个数据提交入口,开避了社会化发现渠道,但超链依然是发现收录链接的最重要入口。

2, 向搜索引擎传递相关性信息:百度除了通过TITLE、页面关键词、H标签等对网页内容进行判断外,还会通过锚文本进行铺助判断。使用图片作为点击入口的超链,也可以通过alt属性和title标签向百度传情达意。

3, 提升排名:百度搜索引擎虽然降低了对超链的依赖,但对超链的识别力度从未下降,制定出更加严格的优质链接、正常链接、垃圾链接和作弊链接标准。对于作弊链接,除了对链接进行过滤清理外,也对链接的受益站进行一定程度的惩罚。相应的,对优质链接,百度依然持欢迎的态度。

4, 内容分享,获取口碑:优质内容被广泛传播,网站借此获得的流量可能并不多,但如果内容做得足够,也可以树立自己的品牌效应。

*严格来讲,这并不属于超链的作用。在百度眼里,网站的品牌比超链要重要得多。

第七章 SEO效果监控及策略修改

1、非流量数据

收录(SEO重点分类,目录查询:Site:www.xxx.com inurl:/a/b/)<内链、抓取友好度、内容原创度不够>、

有效收录:能带来搜索流量的页面

排名

首页、分类、文章页;已有主要排名的升降和新增主要关键词

外链

转化销售或广告收入的升降

2、流量

IP、UV、PV, 平均页面 时常 跳出率 来源(直接网址、搜索引擎<多个搜索引擎>、外部链接)

是否达到预期,是否刻意优化、哪类关键词来路多、用户搜索习惯

3、调整

分析流量页面和用户搜索词,挖掘关键词扩展

排名下滑:内外分析,先静观其变,大幅度下滑改进,优化调整第2、3页的关键词

SEO实验:外链、标题关键词次数、图片alt、页面有无图片等对排名影响

第八章 SEO作弊及惩罚

1、作弊或对搜索引擎不友好手段

常用方式:

1、关键词堆砌:标题、标签、图片ALT文字、正文、页脚、评论、列表等。程度比较模糊,有轻度、重度、极端及无关堆砌。

2、垃圾链接(论坛签名、纯锚文本、锚文本与内容主题不符、群发软件),搜索引擎过滤效果为零

3、买卖链接 判断:主题是否相关、是否大量单向、位置

3、站群 几十几百个 配合采集伪原创工具、链接群发等等(医疗站常用)

4、诱饵替换 以获得正规排名页面替换或增加商业或******非法词 以获得搜索引擎短暂排名(******站常用)

5、利用或劫持高权重网站 百度自身产品 其他博客论坛 政府学校域名网站 注意是否带有nofollow(******站常用)

6、链接向惩罚网站

隐藏文字、桥页等其他方式现在连******/医疗等类站点都已不常用。

2、搜索引擎惩罚

作弊积分制度,单独使用可能在搜索引擎容忍范围,多个被搜索引擎判定为作弊手段可能就会降权惩罚。不要学大网站,搜索引擎对大站名站容忍度更高是为了用户体验,他们经过了长期优质内容积累,用户也信任大站的内容。

惩罚种类:整站删除,排名下降,谷歌付6、负30,百度11位。

检测:site、网站名称(特有或备案号联系方式)首页不在第一、站长平台提醒信息、大部分关键词大幅下降、日志、搜索流量变化(不同搜索引擎)、关键词周期季节热度变化。

3、网站排名波动的主要原因及对策

1、复制程度高,百度认为有质量高于你的网站结果出现(加强内容质量)

2、关键词堆砌、优化过度(降低关键词堆砌痕迹,标题、内文适中自然)

3、服务器宕机、网站打开速度慢(加固或更换服务器,简化代码,查看删改网页卡住的代码,站长平台投诉)

4、被******攻击篡改,友情链接牵连(删除加固,站长平台投诉)

5、程序重要细节问题(url一定要是唯一,同一网页多个url可访问排名结果会有很大影响)

第九章 SEO专题

1、整合搜索(网页搜索并入新闻源、图片、视频、地图等垂直搜索)

图片搜索:ALT、页面标题、图片周围文字、点击图标锚文本、图片像素

视频搜索:标题、描述、播放次数、评论、评分、缩略图

地图搜索:本地商户标注,营业执照、关键词标签

2、更该域名:301,平台验证,更改服务器:抓取ip是否更新

3、SEO与域名

.gov比。com排名好没有根据,只是因为其注册主体决定了网站内容更加可靠高质量,搜索引擎对域名后缀没有偏见,不常见的域名后缀排名少只是因为知道使用的人少而已。

老域名比新域名有力,但要看其什么时候做的网站,有没被惩罚过,域名包含关键词只对英文有好处,续费时间,不要使用匿名注册信息。

4、主机

虚拟主机牵连只存在同服务器上大部分网站都被惩罚,是否抓取正常,稳定性与速度、url重写(伪静态)

5、SEO与品牌:行业展示,专业展示,消除负面

6、地理定位:页面的地理关键词,用户所在地区,国家;关键词、本地网站地图标注。

7、避免过度优化:去优化稀释关键词密度,把时间精力放在创造高质量的内容和吸引分享链接上比花在在页面细节上有效安全的多。

8、用户行为影响搜索排名的猜想

点击率,网站粘度(弹出率、停留时间)、多次搜索及相应网站的访问情况、品牌效应、社会化媒体,回归用户体验。

9、个人化搜索的趋势

百度记录cookie使得经常访问的网站结果被提前,好搜也做过登录后自行排序第一页结果的尝试。

10、百度与Google的区别

一、百度有比较大的首页优势,谷歌对所有页面一视同仁,影响到网站架构关键词布局。

二、百度对外部链接的依耐性比较小,对页面本身的相关性却比较铭感,这种铭感体现在正确的地方出现关键词有助于排名,堆砌关键词容易引来惩罚。谷歌与外部链接很重视,特别是权重较高的链接,对页面关键词出现的频率与位置没那么铭感。

三、百度排名经常大起大落,谷歌渐进式。

四、百度对更新比较看重,谷歌没那么铭感。

11、移动搜索优化

百度把移动网站分为跳转适配(二级域名移动站)、代码适配(url不变一段代码适配)、自适应(url不变,响适应模板适应于所有设备分辨率)三种,当前的情况是百度受限于技术原因,推崇跳转适配,中国四大搜索引擎都有适配通道;谷歌推崇自适应,自适应是潮流,省去了建设优化移动站的麻烦,url不变有利于网站统一,百度也承认自适应的优点,目前仍在努力识别中,自适应优化百度给出是标签标注申明和防止百度转码。

百度移动网站排名因素:移动搜索的结果是由PC搜索结果加入更多的移动端特征后进一步调整而来,优先对移动页面进行排序(PC网站移动化、适配申明、访问速度、地域网络等等)。新站的话建议用自适应,老站的话百度未给出跳转和自适应切换的途径,识别能力目前很差,建议暂时不要更换。

12、APP搜索排名优化

标题、关键词、描述、热度、下载、评分

第十章 SEO观念及原则

1、SEO发展原则

SEO的根本原理在于提高网站内容的相关性(第一代:页面关键词、网站主题)、权威性(第二代:网站自身的积累、外部链接)、实用性(第三代:用户体验、访客行为跟踪),前两者容易作弊,后者作弊难。

2、SEO与赚钱

SEO接单服务,给自己做SEO(资讯信息、B2C电商<货源>)

3、SEO基本而重要的要素

网站结构内链

标题、H1标签包含关键词

正文包含关键词两三次

内容原创避免重复

自然的外部链接

4、内容为王

信息爆炸的同时造成的优质内容匮乏是SEO机会和挑战。

第十一章 SEO工具

1、SEO工具

百度站长平台、百度统计、爱站、站长之家、百度指数(搜索量加媒体曝光)、百度搜索风云榜、百度竞价后台、站长导航

2、SEO学习资源

《百度搜索引擎网页质量白皮书》

《百度移动搜索》

《第37次中国互联网络发展状况统计报告》(2016年1月)

第十二章 SEO项目管理

团队分工:

SEO主管、网页设计、程序优化、内容编辑、友情链接(替代外部链接)、数据分析

优化流程:

1、记录所有修改

2、工作目标(页面、标签、收录、排名、流量,时间)

3、任务分解

4、资源调配

5、内容规范:标题、正文排版 关键词 内容编写

6、获得高层支持(SEO作用、竞争对手、预算、时间期望、执行报告)

7、沟通、内部培训、建立规范(技术:url、标题H1图片alt概述;编辑:标题、正文排版 关键词 内容编写)

8、应急:监控、替代流量、网站诊断

第十三章 搜索引擎排名因素调查

百度排名因素猜想

10分为满分

正面因素

网站关键词及自身因素:

1、标题中出现关键词、关键词完整匹配 10

2、正文、摘要及其他位置出现关键词或关键词的同义词相关词 10

3、H1标签包含关键词 10

4、URL静态化 9

5、原创内容 9

6、网站域名信任程度 8

7、正文内容结果清晰,以1234或者一二三四分段 7

8、正文包含图片 6

9、描述便签包含关键词 5

10、图片ALT 5

11、关键词黑体加粗 5

12、页面更新频率及时间 4

外部链接因素:

13、外部链接的权威相关程度 4

用户行为猜想:

14、搜索结果的点击率 3

15、页面访问时长 3

16、百度分享数量,被微信、微博、豆瓣等分享 3

17、评论 3

负面因素

1、同一网页内容Url存在多个,url存在大量动态参数 10

2、服务器宕机 9

3、网站打开速度慢(服务器和网站代码2方面原因 ) 9

4、大量404等错误页面 9

5、页面出现******、色情关键词,导出链接为被标注为风险或被惩罚的网站 8

6、被判定为链接买卖双方,外链优化过度 8

7、标题、正文关键词堆砌,锚文本过渡优化 8

8、弹窗广告或页面广告太多 7

第十四章 SEO案例分析(略)

作者:呓城之城

来源:卢松松博客(QQ:13340454),欢迎分享本文,转载请保留出处!