分析超大日志文件的梗

发布时间: 2017-02-14

需求背景

因为一次集中的数据清洗，我不得不处理几百G的文件，且由于没有好好斟酌打印日志的方法，最终得到一个4GB的庞然大物。

事后更恶心的是，在清洗过程中有一部分数据处理过程中出现了奇怪的问题，这个时候只能翻阅一下这个4GB成千上万行的日志。可是需要的信息不过几百行罢了，真是大海捞针。

精简问题就是，希望其实是定位文件的XX行到XX行，搜索一番上古神器sed足矣。

sed -n '124010628,124011648p' ./Huge.log

如上指定参数-n后面跟着起始行,结束行p就可以了。