GFS分布式文件系统群集——及搭建

系统运维

内容要点

平塘网站建设公司创新互联建站,平塘网站设计制作，有大型网站制作公司丰富经验。已为平塘成百上千家提供企业网站建设服务。企业网站搭建\成都外贸网站建设公司要多少钱，请找那个售后服务好的平塘做网站的公司定做！

一、GlusterFS 简介：

二、GlusterFS 的卷类型：

三、GlusterFS 部署：

第一步：先将每台虚拟机的各个磁盘挂载好，方便操作，可以使用以下脚本

第二步：在四台 node 节点上的操作

第三步：时间同步

第五步：GlusterFS 卷的创建

第六步：客户端配置

第七步：测试

一、GlusterFS 简介：

GFS是一个可扩展的分布式文件系统，用于大型的、分布式的、对大量数据进行访问的应用。它运行于廉价的普通硬件上，并提供容错功能。它可以给大量的用户提供总体性能较高的服务。

开源的分布式文件系统；

由存储服务器、客户端以及 NFS/Samba 存储网关组成；

（1）GlusterFS 特点：

扩展性和高性能；

高可用性；

全局统一命名空间；

弹性卷管理；

基于标准协议

（2）模块化堆栈架构：

1、模块化，堆栈式结构；

2、通过对模块的组合，实现复杂的功能；

3、GlusterFS 工作流程：

4、弹性 HASH 算法：

通过 HASH 算法得到一个32位的整数；

划分为 N 个连接的子空间，每个空间对应一个 Brick；

弹性 HASH 算法的优点：

保证数据平均分布在每一个 Brick 中；

解决了对元数据服务器的依赖，进而解决了单点故障以及服访问瓶颈。

二、GlusterFS 的卷类型：

（1）分布式卷：

没有对文件进行分块处理；

通过扩展文件属性保存 HASH值；

支持的底层文件系统有 ext3 、ext4 、ZFS 、XFS等

特点：

文件分布在不同的服务器，不具备冗余性；

更容易和廉价地扩展卷的大小；

单点故障会造成数据丢失；

依赖底层的数据保护。

（2）条带卷：

根据偏移量将文件分为 N 块（N个条带节点），轮询的存储在每个 Brick Server 节点；

存储大文件时，性能尤为突出；

不具备冗余性，类似 raid0

特点：

数据被分割成更小块分布到块服务器群中的不同条带区；

分布减少了负载且更小的文件加速了存取的速度；

没有数据冗余

（3）复制卷：

同一个文件保存一份或多分副本；

复制模式因为要保存副本，所以磁盘利用率较低；

多个节点上的存储空间不一致，那么将安装木桶效应取低节点的容量作为该卷的总容量

特点：

卷中所有的服务器均保存一个完整的副本；

卷的副本数量可由客户创建的时候决定；

至少由两个块服务器或更多服务器；

具备容灾性。

（4）分布式条带卷：

兼顾分布式和条带卷的功能；

主要用于大文件访问处理；

至少最少需要 4 台服务器。

（5）分布式复制卷：

兼顾分布式卷和复制卷的功能；

用于需要冗余的情况下

三、GlusterFS 部署：

环境准备：

五台虚拟机，一台作为客户端，另外四台作为节点，每个虚拟机新增4块磁盘（每个20G大小就可以了）

角色空间大小node1（192.168.220.172）80G（20G×4）node2（192.168.220.131）80G（20G×4）node3（192.168.220.140）80G（20G×4）node4（192.168.220.136）80G（20G×4）客户端（192.168.220.137）80G（20G×4）

第一步：先将每台虚拟机的各个磁盘挂载好，方便操作，可以使用以下脚本

vim disk.sh //挂载磁盘脚本，一键操作

#! /bin/bash
echo the disks exist list:
fdisk -l |grep \'磁盘 /dev/sd[a-z]\'
echo ==================================================
PS3=chose which disk you want to create:
select VAR in `ls /dev/sd*|grep -o \'sd[b-z]\'|uniq` quit
do
    case $VAR in
    sda)
        fdisk -l /dev/sda
        break ;;
    sd[b-z])
        #create partitions
        echo n
                p
                
                
           
                w  | fdisk /dev/$VAR
        #make filesystem
        mkfs.xfs -i size=512 /dev/${VAR}1 &> /dev/null
#mount the system
        mkdir -p /data/${VAR}1 &> /dev/null
        echo -e /dev/${VAR}1 /data/${VAR}1 xfs defaults 0 0\\n >> /etc/fstab
        mount -a &> /dev/null
        break ;;
    quit)
        break;;
    *)
        echo wrong disk,please check again;;
    esac
done

第二步：在四台 node 节点上的操作

（1）修改主机名（node1、node2、node3、node4），并关闭防火墙等。

hostnamectl set-hostname node1
hostnamectl set-hostname node2
hostnamectl set-hostname node3
hostnamectl set-hostname node4

（2）编辑 hosts 文件，添加主机名和 IP地址：

vim /etc/hosts #末行插入

192.168.220.172 node1
192.168.220.131 node2
192.168.220.140 node3
192.168.220.136 node4

（3）编写 yum 源的库，安装 GlusterFS ：

cd /opt/

mkdir /abc
mount.cifs //192.168.10.157/MHA /abc   //远程挂载到本地
cd /etc/yum.repos.d/
mkdir bak  
mv Cent* bak/   //将原来的源都移到新建的文件夹中

vim GLFS.repo   //新建一个源
[GLFS]
name=glfs
baseurl=file:///abc/gfsrepo
gpgcheck=0
enabled=1

（4）安装软件包：

yum -y install glusterfs glusterfs-server glusterfs-fuse glusterfs-rdma

（5）开启服务：

systemctl start glusterd
systemctl status glusterd

第三步：时间同步

ntpdate ntp1.aliyun.com   //时间同步（每台节点都需要操作）

添加存储信任池，只要在一台主机上添加其他三台节点即可：

这是在 node1 节点上的操作：

gluster peer probe node2
gluster peer probe node3
gluster peer probe node4

gluster peer status //查看所有节点状态

第五步：GlusterFS 卷的创建

（1）创建分布式卷：

gluster volume create dis-vol node1:/data/sdb1 node2:/data/sdb1 force
  //利用node1和node2上的两块磁盘创建；dis-vol为磁盘名；force表示强制
     
gluster volume start dis-vol    //启动
gluster volume info dis-vol     //查看状态

（2）创建条带卷：

gluster volume create stripe-vol stripe 2 node1:/data/sdc1 node2:/data/sdc1 force
gluster volume start stripe-vol
gluster volume info stripe-vol

（3）创建复制卷：

gluster volume create rep-vol replica 2 node3:/data/sdb1 node4:/data/sdb1 force

gluster volume start rep-vol
gluster volume info rep-vol

（4）创建分布式条带卷（至少4个节点）：

gluster volume create dis-stripe stripe 2 node1:/data/sdd1 node2:/data/sdd1 node3:/data/sdd1 node4:/data/sdd1 force
gluster volume start dis-stripe
gluster volume info dis-stripe

（5）创建分布式复制卷（至少4个节点）：

gluster volume create dis-rep replica 2 node1:/data/sde1 node2:/data/sde1 node3:/data/sde1 node4:/data/sde1 force

gluster volume start dis-rep
gluster volume info dis-rep

第六步：客户端配置

（1）关闭防火墙

systemctl stop firewalld
setenforce 0

（2）配置安装 GFS 源：

cd /opt/
mkdir /abc
mount.cifs //192.168.10.157/MHA /abc   //远程挂载到本地
cd /etc/yum.repos.d/

vim GLFS.repo   //新建一个源
[GLFS]
name=glfs
baseurl=file:///abc/gfsrepo
gpgcheck=0
enabled=1

yum -y install glusterfs glusterfs-fuse   //安装软件包

（3）修改 hosts文件：

vim /etc/hosts

192.168.220.172 node1
192.168.220.131 node2
192.168.220.140 node3
192.168.220.136 node4

（4）创建临时挂载点：

mkdir -p /text/dis   //递归创建一个挂载点
mount.glusterfs node1:dis-vol /text/dis/         //挂载分布式卷

mkdir /text/strip
mount.glusterfs node1:stripe-vol /text/strip/     //挂载条带卷

mkdir /text/rep
mount.glusterfs node3:rep-vol /text/rep/          //挂载复制卷

mkdir /text/dis-str
mount.glusterfs node2:dis-stripe /text/dis-str/    //挂载分布式条带卷

mkdir /text/dis-rep
mount.glusterfs node4:dis-rep /text/dis-rep/        //挂载分布式复制卷

df-hT：查看挂载信息：

第七步：测试

（1）创建 5 个40M 的文件：

dd if=/dev/zero of=/demo1.log bs=1M count=40
dd if=/dev/zero of=/demo2.log bs=1M count=40
dd if=/dev/zero of=/demo3.log bs=1M count=40
dd if=/dev/zero of=/demo4.log bs=1M count=40
dd if=/dev/zero of=/demo5.log bs=1M count=40

（2）把刚刚创建的 5 个文件分别复制到不同的卷上：

cp /demo* /text/dis
cp /demo* /text/strip
cp /demo* /text/rep/
cp /demo* /text/dis-str
cp /demo* /text/dis-rep

（3）查看各个卷是如何分布的：ll -h /data/sdb1

1、分布式卷：

可以看出都是每个文件都是完整的。

2、条带卷：

所有文件都被分成各一半进行分布存储。

3、复制卷：

所有文件都被完整复制一遍，进行存储。

4、分布式条带卷：

5、分布式复制卷：

（4）故障破坏测试：

现在关闭第二台节点服务器，模拟宕机；再在客户机上查看各个卷的情况：

可以发现：

分布式卷所有文件都在；

复制卷所有文件都在；

挂载分布式条带卷只有 demo5.log 一个文件了，丢失了4个；

挂载分布式复制卷所有文件都在；

条带卷所有文件都丢失了。

（5）其他操作：

1、删除卷（先停止，再删除）：

gluster volume stop 卷名
gluster volume delete 卷名

2、黑白名单设置：

gluster volume set 卷名 auth.reject 192.168.220.100     //拒绝某台主机挂载
gluster volume set 卷名 auth.allow 192.168.220.100      //允许某台主机挂载

新闻名称：GFS分布式文件系统群集——及搭建
文章源于：http://scjbc.cn/article/cpdeod.html

GFS分布式文件系统群集——及搭建

其他资讯