1. HDFS元数据原理流程

2. 自己实现分段加锁和双缓冲方案(百分之95的相似,比hdfs优化了一些地方)

2.1 DoubleBuffer

package com.bigdata.hdfs.app.double_memery;

import java.util.LinkedList;

/**
 * Copyright (c) 2019 leyou ALL Rights Reserved Project: learning Package:
 * com.bigdata.hdfs.app.double_memery Version: 1.0
 *
 * @author qingzhi.wu
 * @date 2020/7/5 16:41
 */
public class DoubleBuffer {
    /**
     * 内存1
     */
    LinkedList<EditLog> currentBuffer = new LinkedList<EditLog>();
    /**
     * 内存2
     */
    LinkedList<EditLog> syncBuffer = new LinkedList<EditLog>();

    /**
     * 把数据写到当前内存
     *
     * @param log
     */
    public void write(EditLog log) {
        currentBuffer.add(log);
    }

    /**
     * 两个内存交换数据
     */
    public void setReadyToSync() {
        LinkedList<EditLog> tmp = currentBuffer;
        currentBuffer = syncBuffer;
        syncBuffer = tmp;
    }

    /**
     * 获取当前正在刷磁盘的内存里的ID最大值
     * @return
     */
    public Long getSyncMaxTxid(){
        return syncBuffer.getLast().txid;
    }

    /**
     * 就是把数据写到磁盘上面
     * 为了演示效果,所以我们只是打印出来
     */
    public void flush(){
        for (EditLog editLog : syncBuffer) {
            System.out.println(editLog);
        }
        syncBuffer.clear();
    }

}

2.2 EditLog

package com.bigdata.hdfs.app.double_memery;

/**
 * Copyright (c) 2019 leyou ALL Rights Reserved
 * Project: learning
 * Package: com.bigdata.hdfs.app.double_memery
 * Version: 1.0
 *
 * @author qingzhi.wu
 * @date 2020/7/5 16:38
 */

/**
 * 使用了面向对象的思想,把一条日志看成一个对象
 * 日志信息,或者就是我们说的元数据信息
 */
public class EditLog {
    /**
     * 日志的编号,递增,并且是唯一的
     */
    long txid;
    /**
     * 日志的内容
     */
    String context;

    public EditLog(long txid, String context) {
        this.txid = txid;
        this.context = context;
    }

    /**
     * 方便我们打印日志
     * @return
     */
    @Override
    public String toString() {
        return "EditLog{" +
                "txid=" + txid +
                ", context='" + context + '\'' +
                '}';
    }
}

2.3 FSEditLog

package com.bigdata.hdfs.app.double_memery;

/**
 * Copyright (c) 2019 leyou ALL Rights Reserved
 * Project: learning
 * Package: com.bigdata.hdfs.app.double_memery
 * Version: 1.0
 *
 * @author qingzhi.wu
 * @date 2020/7/5 16:52
 */
public class FSEditLog {

    private long txid = 0L;
    private DoubleBuffer editLogBuffer = new DoubleBuffer();
    private volatile Boolean isSYncRunning = false;
    private volatile Boolean isWaitSync = false;
    private volatile Long syncMaxTxid = 0L;

    /**
     * 一个线程 就会有自己的一个ThreadLocal的副本
     */
    private ThreadLocal<Long> localTxid = new ThreadLocal<Long>();

    public static void main(String[] args) {

    }

    /**
     * 写元数据日志的方法
     *
     * 线程1,
     * 顺序
     *
     * hadoop fs mkdir /data 1
     * hadoop fs delete /data 2
     * @param content
     */
    public void logEdit(String content){ //mkdir /data
        synchronized (this){
            //日志的ID号,元数据信息的ID号
            txid++;

            /**
             * 每个线程都会有自己的一个副本
             * 线程1 1
             * 线程2 2
             * 线程3 3
             */
            localTxid.set(txid);

            EditLog log = new EditLog(txid,content);
            // 往内存里面写数据
            editLogBuffer.write(log);
        }//释放锁

        /**
         * 内存1:
         * 线程1,1 元数据1
         * 线程2,2 元数据2
         * 线程3,3 元数据3
         */
        logSync();

    }
    private void logSync(){
        /**
         * 线程1,ID号:1
         */

        synchronized (this){
            //当前是否正在往磁盘写数据,默认是false
            //这个值为true
            if(isSYncRunning){

                //当前线程的副本,当前的元数据信息编号就是2
                long txid = localTxid.get();

                // 当前线程编号如果小于 正在刷写的最大的
                if(txid <= syncMaxTxid){
                    return ;
                }

                if(isWaitSync){
                    //直接返回
                    return ;
                }

                //重新赋值
                isWaitSync = true;
                while(isSYncRunning){
                    try {
                        //线程4就会在这里等待
                        //释放锁
                        /**
                         * 时间到了
                         * 被唤醒了
                         */
                        wait(2000);
                    } catch (InterruptedException e) {
                        e.printStackTrace();
                    }
                }

            }
            /**
             * 交换内存,我是直接交换的内存,肯定是简单粗暴
             * 真正的源码里面是有判断的
             * 如果来不来就直接交换内存,频繁的交换内存,是很影响性能的.
             */
            editLogBuffer.setReadyToSync();

            if(editLogBuffer.currentBuffer.size()>0){
                //获取当前 内存2(正在往磁盘上面写数据的那个内存)
                //里面元数据日志编号最大的是多少

                syncMaxTxid = editLogBuffer.getSyncMaxTxid();
            }

            isSYncRunning=true;
        } //释放锁

        //往磁盘上面写数据(这个操作是很耗费时间的)

        /**
         * 线程一 执行如下代码
         *
         * 在最耗费时间的这段代码上面是没有加锁的
         * 几毫秒,几十毫秒
         */
        editLogBuffer.flush(); //然后就写完了

        synchronized (this){
            //状态恢复
            isSYncRunning = false;
            //唤醒当前wait的线程
            notify();
        }

    }
}

2.4 TestNameNode

package com.bigdata.hdfs.app.double_memery;

/**
 * Copyright (c) 2019 leyou ALL Rights Reserved
 * Project: learning
 * Package: com.bigdata.hdfs.app.double_memery
 * Version: 1.0
 *
 * @author qingzhi.wu
 * @date 2020/7/5 17:45
 */
public class TestNameNode {
    public static void main(String[] args) {
        final FSEditLog fsEditLog = new FSEditLog();

        for (int i = 0; i < 50; i++) {
            new Thread(()-> {

                for (int j = 0; j < 1000; j++) {
                    fsEditLog.logEdit("日志信息");

                }
            }
                    ).start();
        }
    }
}

HDFS源码解析之简易分段锁双缓冲机制实现(五)

1. HDFS元数据原理流程

2. 自己实现分段加锁和双缓冲方案(百分之95的相似,比hdfs优化了一些地方)

2.1 DoubleBuffer

2.2 EditLog

2.3 FSEditLog

2.4 TestNameNode

猜你喜欢