Dragonchu Blog

ARIES论文研读（1）

论文名称：《ARIES: A Transaction Recovery Method Supporting Fine-Granularity Locking and Partial Rollbacks Using Write-Ahead Logging》章节：Abstract ARIES的厉害之处 ARIES怎么做到的 ARIES：Algorithm for Recovery and Isolation Exploiting Semantics support partial rollbacks of transactions support fine-granularity(e.g. record) locking and recovery support fuzzy checkpoints, selective and deferred restart, fuzzy image copies, media recovery, and high concurrency lock modes 使用write-ahead logging(WAL) repeating history → redo all missing update before performing the rollbacks of the the loser transactions during restart after a system failure...

收纳原则

对我而言，收纳一直是个很痛苦的事情。如何把家中各种物品放在它应该在的位置，保持家中条理清晰，干干净净。今天终于腾出时间，稍微整理了一下房间，因为保守起见，收纳箱只买了两个，导致其他物品没地方放了就暂时停止，等新购的三个收纳箱到了之后再继续收纳。不过今天突然对收纳有了一点点开窍，没读过相关的书籍和攻略，全是个人体验，后续有时间可以了解了解这方面的内容，应该是有相关的领域的。毕竟收纳也是一种组织行为。我自己的小心得：物品放在哪里取决于它最常使用的位置之前我总是陷入一个误区，东西放在哪里是看它是什么。比如杯子应该放在桌子上。但如果我的杯子是做为一个花盆，那它就该放在阳台上。而且，如果我有很多杯子，有的杯子我习惯在电脑桌上喝水，有的比较大我习惯在厨房用，那就应该分开来放。它在哪个地方用的最多，就应该放到那个地方去。这里也是一个生活小哲学了，不要拘泥于标签，标签一定是在行为出现之后做的一个划分而已。比如职业，我是一个程序员但我不只是程序员，也不可能只是程序员。我有这方面的技能，为了简单与他人做一个区分给我一个标签，但标签只是附加的一个分类，它与我的本质，我的过去与未来毫无关联。只是一种语言上的方便而已。一件物品很久不用了就应该存储或者丢弃我有一个手机支架，但是这个手机支架适合手机横着放，它的体积特别大，在我有限的书桌上一直很碍事，但我之前总觉得书桌上要放一个手机支架，所以我就一直把这个碍事的手机支架摆在书桌上，我使用它的频率几乎为0。因为我要是在书桌上看视频，我可以直接拿我的mac看。所以这一次我直接把它丢进收纳箱了，或许未来必须看手机时可以拿出来用一下。备用物品在完成使命后就该丢弃我买一些自己组装的家具或者物品时，卖家通常会多给一些零部件保证我能顺利安装。之前我总是会把这些零件囤起来，抱着万一坏了还能拿这些零部件修一下的念头。但是至今为止，我都没有一次拿存下来的零部件修过物品。这些零部件存在的目的是保证安装时能顺利，而维修和安装是两件事，维修需要维修工具，需要维修技巧。囤着安装的备用物品，整理他们的时间远高于它们被使用到的价值。甚至，如果不分类整理，就算物品坏了要维修，也不知道哪个零部件用得上。

关于密室的一点想法

自从大学时搞话剧社，被团委疯狂毙剧本后，我就一直抱着话剧已死的心态看待话剧。除了偶尔的兴起，尝新的体验，专业学习，我想不到普罗大众有什么理由去看话剧演出。电影，电视剧，短视频的兴起已经完全淹没了话剧曾经的辉煌。或者应该这样说，话剧这种表演艺术形式相对于电影与电视剧就是马车与汽车的区别。是的，老一派当然可以说话剧的欣赏自然有它的魅力，现场看肯定能看到与线上不同的效果，但我认为，这些所谓独特的体验，与坐马车是一样的。我坐马车也有独特的体验，可以慢慢悠悠欣赏沿途的风景，体验体验颠簸，但也只是体验而已，现实的交通还是得坐汽车。去看一场话剧演出，如果位置不好看得还不如看电影。我花那么多钱去坐一个差位置岂不是遭罪。所以我觉得话剧这个东西就是没什么前途，演员赚不到饭钱还有谁会继续做，当个艺术搞搞还行，但是搞艺术就不要把赚不到钱的原因怪大众审美不行，自己落伍了别拉着人民群众垫背。不过，最近在同事的带领下体验了几次高质量的真人NPC密室，其中有一场我觉得可以当演出来看（虽然我胆小没有完全细看）。在话剧这个行业，我当然了解的不是很深入了，一直说搞一种沉浸式演出，我不知道这是学院派提出来的，还是谁搞出来的，大概就是观众和表演的互动性很强。可是这不就是密室吗？颇有OSI和TCP/IP的范儿了，学院派和实践派。不过密室这东西应该是纯纯的民间艺术，我猜是从鬼屋进化而来，刚兴起那会品质还是一般的，不过现在的密室的精致以及NPC的表演能力，实在令我惊叹。我猜想，再发展几年，这个行业应该也会正规化了，到时候各大表演系的学生只不准就有很多直接投身于此，而且这也是个很好的职业。畅想一下，当然这篇文章也是我随性而想，没有调研，接下来我畅想的事可能已经发生或者正在发生。如果有公司全力投入，正规化密室，或者后续起一个新概念，沉浸式体验馆（现在好像不少密室已经叫这个了），然后培养一批非常专业的演员，倒也是新时代话剧了。 April 16, 2023 后来又去看了一些关于密室从业者的采访以及文章，发现并没有那么轻松简单。一方面密室的剧本以及场景搭建大部分都是友专门的公司搭建的，这些公司估计不直接参与营业，而是负责机关设计，剧本设计（我觉得这才是赚钱的大头），大部门开办密室的，自己其实没有剧本生产能力以及密室搭建能力（包括机关设计）。一般一个密室要建起来，前期投资就得几十万，可能二三十万的样子。而搭建完毕后，第一有没有人玩儿，第二密室很多都是一次性的，用户玩儿好后就不玩儿了（现在很多密室的设计和剧本都是有多刷机制，但是再怎么多，也就那么几次）。

Mysql主从复制安装

阅读前了解一下mariadb与mysql的关系 centos7使用二进制包安装mysql sudo groupadd mysql sudo useradd -r -g mysql -s /bin/false mysql cd /usr/local sudo tar zxvf /path/to/mysql-VERSION-OS.tar.gz sudo ln -s full-path-to-mysql-VERSION-OS mysql # 如果要删除软链接使用unlink mysql cd mysql sudo chown mysql:mysql -R /usr/local/mysql sudo chmod 755 /usr/local/mysql/ 修改/etc/my.cnf配置 [mysqld] bind-address=0.0.0.0 port=3306 user=mysql basedir=/usr/local/mysql datadir=/usr/local/mysql/data socket=/tmp/mysql.sock log-error=/usr/local/mysql/data/mysql.err pid-file=/usr/local/mysql/data/mysql.pid #character config # character_set_server=utf8mb4 # symbolic-links=0 # #explicit_defaults_for_timestamp=true # # # Settings user and group are ignored when systemd is used. # If you need to run mysqld under a different user or group, # customize your systemd unit file for mariadb according to the # instructions in [http://fedoraproject....

ANTLR学习笔记（2）

书籍名称：The definitive ANTLR 4 Reference 章节：Chapter4 A quick tour ANTLR解析的模版 g4文件中这样定义可以在生成的java文件中创造出常量MUL 使用vistor手动遍历使用Listener 还可以深度自定义 public static void main(String[] args) throws IOException { String inputFile = null; if (args.length > 0){ inputFile = args[0]; } InputStream is = System.in; if(inputFile!=null){ is = new FileInputStream(inputFile); } ANTLRInputStream input = new ANTLRInputStream(is); ExprLexer lexer = new ExprLexer(input); CommonTokenStream tokens = new CommonTokenStream(lexer); ExprParser parser = new ExprParser(tokens); ParseTree tree = parser.prog(); System.out.println(tree.toStringTree(parser)); } 词法解析和语法解析可以拆分成两个文件，使用idea插件生成只需要先生成词法再生成语法就可以。...

死亡在冬日

这是一篇旧稿，迁移到本博客给活着的老人做棺材有一个专门的说法叫做做柴。柴字到底是怎么写我也不是很清楚，发音确实叫柴。做柴要请人吃饭，我母亲的好友的母亲做柴，请我去吃饭。我自从在外求学就没有见过这位老人家。先见面的是她的丈夫，背比我记忆中驼了很多，头发光泽也黯淡了不少，走路开始有点颤颤巍巍的了。后来也见到那位奶奶，看上去虽然显老，但也挺有精神。我的母亲告诉我，这位老人被查出来患了癌症。医生刚说这个消息的时候她家里人谁也不信，觉着老人家精神挺好的，说话做事也并无大碍。医生说现在看上去好好的，谁知道哪一天就头一仰倒下去。家里人要带老人家去大医院再去诊一诊，老人家摆摆手不愿去。我的母亲说我北边奶奶的柴也做了好几年了，就放在后面茅坑旁边的屋子里。饭桌上自然聊邻里奇闻轶事，谈论的最多的是我东边的维来爷爷家的女婿喝酒开电动车摔死了。我小时候一直喜欢跑到维来爷爷家要喝他家的奶粉，但长大后很少去他家，因为他家有一只贼凶的狗，我一路过就冲着我旺旺大叫。加上以前维来爷爷家是养鸽子的，每次我一去，狗叫鸽子飞，好不热闹。但是维来爷爷的女婿我从没见过，直到那天去吃席，交份子钱的时候路过灵堂，看到尸体的脑袋缠上满满当当的绷带。我撇了一眼就走了，不敢仔细看。我的姑爷来我家吃饭时说他见了那个女婿的头，肿成了猪头，很难看。维来爷爷的孙女上高二了，我们吃席的时候有礼仪牵着她给大家磕头，每一个人都放下了碗筷端详着她，就像洞里一只只倒挂的蝙蝠。我的母亲说维来爷爷的女儿这几天一定会瘦很多，已经好几天没怎么吃饭了，邻里都去安慰她。姑爷说她反正已经够胖了，瘦一点也好。我朋友的老太也去世了，应该算善终，活了八九十岁了，拉扯大了九个孩子。只是我去我朋友家时，他的奶奶把我认错成另一个人了。小的时候这位奶奶对我很是亲切，但现在少了几分亲近，因为她大抵是不认识现在的我了。今年过年很是冷清，年前大家都讨论着维来该怎么过这个年。年后大家都在骂维来女婿在外面赌钱欠了二十多万。我想着躺在灵堂的那个人，维来家什么时候没有鸽子了，我也记不得了。

ANTLR学习日志

阅读的是作者自己写的**The Definitive ANTLR 4 Reference** 使用方式：要装有jdk cd /usr/local/lib # 找一个想安装的目录就行 curl -O https://www.antlr.org/download/antlr-4.0-complete.jar# 这里必须使用https的链接，https://github.com/antlr/antlr4/issues/2422 # 一个jar包就可以跑了，下面都是为了省事 export CLASSPATH=".:/usr/local/lib/antlr-4.0-complete.jar:$CLASSPATH" alias antlr4='java -jar /usr/local/lib/antlr-4.0-complete.jar' helloword grammar Hello; // Define a grammar called Hello r : 'hello' ID ; // match keyword hello followed by an identifier ID : [a-z]+ ; // match lower-case identifiers WS : [ \t\r\n]+ -> skip ; // skip spaces, tabs, newlines, \r (Windows) antlr4 Hello.g4 javac *....

HadoopMapReduce代码分析GrepExample（二）

run方法先进行命令行参数校验，没什么好看的。接下来创建临时文件，用的是Path类，目前也没什么好看的。接下来获取Configuration，用的实现的接口的getConf()，在之前ToolRunner中已经set了一个了，这个Configuration很简单，直接new出来的，loadDefaults为true。（Context和conf是不一样的两个东西） conf目前看起来是简单的map存放各种配置，里面会有些对过期的key的检查与设置。接下来创建了一个Job，job里面用了深拷贝将conf里的配置拷贝给自己，这样job中随便怎么修改conf也不会影响外部，深拷贝将conf变成了JobConf。然后在Job中set需要执行的类，这次就是Grep.class，我觉得这一步非常关键，好好学一下。进去之后就是先找jar包，好像确实就是找jar，最后返回的是file:这种通用文件定位格式的字符串。后面的设置mapper,reducer,combiner class没什么复杂的，就是把对应的class保存起来。重头戏应该是waitForCompletion，这个函数就是将job提交到cluster。 Job一共就只有两种状态，DEFINE，RUNNING，如果是DEFINE那就提交。粗看了一下，这里的wait是提交上去之后立即返回，然后不断轮询状态，要是轮询失败了就抛异常。看看submit()函数里具体做了什么。好吧，submit这里就有点看不懂了，好像做了一些mock，得debug进去看一看

手机人生

来北京工作之后办了一张北京的中国移动卡，办完之后才发现是一张刚注销的卡。这张卡还绑定着原机主的银行卡，所以原机主的转账记录收入支出的信息都发给我了。从短信内容来看，原机主应该是个房东，因为这张卡绑定的银行卡的每月收入都来自自如的转账。而且中间有几次中介打电话问我要不要考虑卖掉哪儿哪儿哪儿的一套房。每个月我收到工资后先划出一部分交房租的时候，我的手机倒是会弹出收租的信息，倒是同时体验了一把房东的快乐。今天大概是他的子女来京？早上七点多给我打电话，听那边的声音说刚下飞机，说这个手机号是她的不知道为什么串号了。这个时间工作日坐飞机来北京，大概率是大学生？返校季。后来又有个男人打电话给我，可能是女子不清楚发生什么了，让胆大的来。不过好笑的是，每次对方都问我我是哪位？那我怎么自我介绍？难道还得把自己生世阐述一番？我也只好以问代答，“您是哪位”。中国的见面招呼已经从“吃饭了”变成了“你哪位？”，感觉有“how do you do”的无厘头之势。我看场面太尴尬，就直接说明了这个手机号应该是原主人注销了，请麻烦通知原主人还有他的亲朋好友。男人用一口很地道的北京话对我道谢。以后可能不能再体会一下房东的快乐了吧。

HadoopMapReduce代码分析GrepExample（一）

Grep程序在谷歌的MapReduce论文中也作为示例程序提到过，在大规模数据集中并行找出符合指定模式的文件。 https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/SingleCluster.html 按照官方指南，只需要在hadoop安装目录下用hadoop程序就可以作为单机来跑hadoop 按照官方的指南，跑一个简单的grep程序，具体的jar包得看使用的自己使用的版本 $ mkdir input $ cp etc/hadoop/*.xml input $ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.4.0-SNAPSHOT.jar grep input output 'dfs[a-z.]+' $ cat output/* 启动jvm的调试功能，只需要在hadoop-env.sh中添加 export HADOOP_OPTS="-agentlib:jdwp=transport=dt_socket,server=y,suspend=y,address=5005" （这部分是jvm调试相关）在idea中打上断点，通过查看haoop-mapreduce-examples模块中的pom文件，可以看到在打包插件里指定了org.apache.hadoop.examples.ExampleDriver类为启动类。那么就从这个类开始分析吧。 ExampleDriver这个类是用来将各种测试类注册进去并加上一些文字性描述，能看到自带了很多实例程序，我这次分析的是grep程序，对应注册的是Grep类。 ExampleDrive类中使用ProgramDriver类，这个ProgramDriver中使用一个map保存测试类和他们对应的名字关系，而测试类在ProgramDriver中被解析成ProgramDescription，ProgramDescription中保存了测试类的main方法和描述，然后测试时，比如我们的grep程序，先用grep这个名字找到对应的ProgramDescription然后直接调用main方法把命令行中的剩余参数传入。接下来看一下Grep中的main方法 main方法中用了一个ToolRunner去run，run方法中提供了Configuration类，Grep类，和参数，能猜到应该是使用了默认的配置项去调用Grep，能看到这里的核心是一个Tool接口，Grep继承了Tool接口，ToolRunner会运行Tool。根据javadoc看看Tool是什么看样子hadoop为了方便测试写的一个接口，把一些环境的初始化配置隐藏起来了。那来看看Configuration是什么，这个应该是核心类这个Configuration就负责加载core-site那些配置文件已经用户程序中设定的配置，具体的配置目前应该没必要深究。可以看到使用默认配置是将loadDefault这个bool值设为false，然后往一个WeakHashMap中put一个key为自己，value为null的键值对。第一次看到WeakHashMap，学一下。 https://web.archive.org/web/20061130103858/http://weblogs.java.net/blog/enicholas/archive/2006/05/understanding_w.html 这里使用的原因，应该是为了没有地方继续使用Configuration时可以让垃圾回收机自动回收这个entry，Configuration应该是一个比较大的对象。有几个问题，第一，什么时候Configuration会不再有对象引用呢？第二，这里的map中会存放哪些Configuration呢？第三，是通过把各种不同路径的C configuration都存在这里然后只用其中的部分，剩下的部分如果一直不使用就让垃圾回收器回收吗？现在可以进入ToolRunner方法中去看了一上来就是CallerContext.getCurrent()，经常看到一些这种getCurrent的操作，今天仔细盘一下。进去之后调用的是CurrentCallerContextHolder.CALLER_CONTEXT.get() 类描述里贴心的给了链接https://en.wikipedia.org/wiki/Initialization-on-demand_holder_idiom 学一下，原来这就是线程安全的单例的使用案例，利用jvm初始化类的特性。不过这个单例有点变种，返回的是ThreadLocal变量，这部分内容我还是有点生疏。学习一下ThreadLocal 我现在理解的是ThreadLocal给每个线程属于自己的对象， ThreadLocal表示线程的“局部变量”，它确保每个线程的ThreadLocal变量都是各自独立的；ThreadLocal适合在一个线程的处理流程中保持上下文（避免了同一参数在所有方法中传递;https://www.liaoxuefeng.com/wiki/1252599548343744/1306581251653666 而inheritableThreadLocal会让每个子进程继承父进程的threadlocal CallerContext是一个单例，使用线程安全的单例模式，CALLER_CONTEXT这个线程变量就是实例，那就是说CallerContext在每个线程中只存放一份。 “单例”模式-ThreadLocal线程单例再回到ToolRunner的run方法，通过getCurrent()获取当前线程的CallerContext，第一次应该没有（因为没有写initValue方法），所以手动构造一个CallerContext。CallerContext中还有个建造者，使用建造者模式build出CallerContext。这个builder构造函数目前看起来就是简单的把context存起来，当然前面做了一些简单的合法判断。最终build时设置了context和signature两个变量，目前不是很清楚是干什么的。好，现在已经有了线程的CallderContext了，接下来是一个CommonAuditContext.noteRntryPoint(tool), 这个函数将类和一个PATAM_COMMAND（字符串）放到一个全局的map中去了，我猜这个应该是开启审计功能的开关？后面审计部分可能会看那个全局表。然后是再判断conf是不是null，是就再创建一个新的。感觉有点冗余。接下来创建了一个GenericOptionsParser，这个类是用来解析命令行参数的，其实感觉像开源项目中这种解析命令行参数的类还是值得看得，不然每次命令行参数都用的云里雾里的。里面用了另一个开源的参数解析包CLI，就不细看了。 Grep类继承了Configured，而Configured又实现了COnfigurable接口，所以有setConf()以及Configuration，run方法中把生成的conf给set进了tool自己 set the configuration back, so that Tool can configure itself...