linux – 使用“uniq -c”命令时需要从输出中删除计数
我正在尝试读取文件并按特定字段的出现次数对其进行排序.假设我想从日志文件中找出最重复的日期,然后我使用uniq -c选项并按降序排序.这样的事情
这将产生这样的输出 –
实际上是计数的第一个字段对我来说是个问题….我想从上面的输出得到日期,但是我无法得到它.我尝试使用cut命令并执行此操作
但这只是打印空白区域…请有人帮助我获取日期并切断计数.我只想要
谢谢 最佳答案 来自uniq的计数前面有空格,除非计数中有超过7位数,因此您需要执行以下操作:
获取列(字符位置)9向上.或者你可以使用sed:
要么:
面对重复计数10,000,000或更多,第二种选择是强劲的;如果你认为这可能是一个问题,它可能比削减替代品更好.毫无疑问,还有其他选择. 警告:计数是通过Mac OS X 10.7.3上的实验确定的,但是使用来自coreutils 8.3的GNU uniq. BSD uniq -c在单个数字计数之前产生3个前导空格. POSIX规范说
这不会有任何领先的空白.鉴于输出格式可能出现这种差异,带有[0-9]正则表达式的sed脚本是处理uniq -c的观察和理论输出变化的最可靠方法: (编辑:安卓应用网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
- linux – 什么是gssapi-with-mic?
- LINUX实操:Ubuntu 16.04 LTS Django虚拟开发环境配置
- linux – SETENV:Bad:$($)中的修饰符
- linux – 如何对多个文件执行拼写检查,并在shell脚本中显示
- linux – 升级代理NGINX服务器的内核是否足以阻止CVE-2017-
- linux-networking – NAPI与Adaptive Interrupts
- linux – 支持颜色的“更多”命令替代方案?
- nfs – ZFS – 销毁重复数据删除的zvol或数据集会使服务器停
- linux – 临时重命名/ tmp然后创建一个tmp符号链接到另一个
- 用户空间进程是否抢占了内核线程?